الإبداع البشري مقابل الإبداع الاصطناعي: أين يكمن الاختلاف الحقيقي (ولماذا يعلمنا أسلوب جيبلي شيئاً ما)
احتدم النقاش حول الذكاء الاصطناعي وحقوق النشر بشكل كبير في 2024-2025. لم تعد هذه المناقشات نظرية: فقد رفعت صحيفة نيويورك تايمز دعوى قضائية ضد شركة OpenAI لانتهاك حقوق النشر (ديسمبر 2023)، ورفعت شركة Getty Images دعوى قضائية ضد شركة Stability AI، ورفع آلاف الفنانين دعاوى جماعية. وترد شركات الذكاء الاصطناعي بأن أنظمتها "تتعلم" مثل البشر تماماً - ولكن هل هذا هو الحال حقاً؟
لطالما تطور الإبداع البشري من خلال الروابط: استوحى شكسبير إبداعه من السجلات التاريخية والحكايات الشعبية، ودرس فان جوخ المطبوعات اليابانية، وبدأت فرقة البيتلز بعزف موسيقى الروك الأمريكية. ودائماً ما يعيد الفنانون تفسير الأعمال السابقة. والذكاء الاصطناعي، كما تقول شركات التكنولوجيا، يفعل الشيء نفسه. لكن حالة "أسلوب جيبلي" تكشف مدى بساطة هذا السرد.
اكتب "أسلوب جيبلي" في "ميدجورني" أو "دال-إي" وستحصل على صور مشابهة بشكل لافت للنظر لروائع هاياو ميازاكي: ألوان الباستيل والغيوم الرقيقة والمناظر الطبيعية الشبيهة بالأحلام والشخصيات ذات العيون الكبيرة. إنه مثير للإعجاب من الناحية الفنية. كما أنها إشكالية للغاية.
استغرق استوديو جيبلي عقودًا من الزمن لتطوير تلك الجمالية المميزة: خيارات دقيقة للألوان وتقنيات الرسوم المتحركة التقليدية وفلسفة فنية متجذرة في الثقافة اليابانية ورؤية ميازاكي الشخصية. عندما يقوم نموذج ذكاء اصطناعي بتكرار هذا "الأسلوب" في ثوانٍ، هل هو حقًا "يتعلم" كما تعلم ميازاكي من رسوم ديزني المتحركة والمانجا اليابانية؟ أم أنه ببساطة يعيد تجميع الأنماط البصرية المستخرجة من آلاف الإطارات من أفلام جيبلي دون إذن؟
الفرق ليس فلسفيًا - إنه قانوني واقتصادي. وفقًا لتحليل ستانفورد المنشور في arXiv (كارليني وآخرون، 2023)، يمكن لنماذج الانتشار مثل Stable Diffusion أن تعيد توليد صور متطابقة تقريبًا من مجموعة التدريب في حوالي 3 في المائة من الحالات عندما يُطلب منها ذلك بمحفزات محددة. هذا ليس "إلهامًا"، بل هو تخزين وإعادة إنتاج.
اكتشف الفنان الرقمي البولندي غريغ روتكوفسكي أن اسمه ظهر في 1.2 مليون مطالبة على موقع Stable Diffusion - دون قصد منه - ليصبح أحد أكثر "الأنماط" طلباً دون أن يعطي موافقته أو يتلقى تعويضاً. وكما قال لمجلة إم آي تي تكنولوجي ريفيو: "لا أشعر بالإطراء. أشعر وكأن شيئاً بنيته لسنوات قد سُرق مني.
وصل حجم تدريب الذكاء الاصطناعي إلى نطاقات غير مسبوقة. تحتوي LAION-5B، وهي إحدى مجموعات البيانات الأكثر استخدامًا لنماذج الصور، على 5.85 مليار زوج من الصور والنصوص التي تم جمعها من الإنترنت - بما في ذلك الأعمال المحمية بحقوق الطبع والنشر. وقد تم تدريب GPT-4 على أجزاء ضخمة من الإنترنت، بما في ذلك المقالات المدفوعة والكتب ورموز البرامج المسجلة الملكية.
الإجراءات القانونية الرئيسية الجارية:
تدافع شركات الذكاء الاصطناعي عن هذه الممارسة من خلال التذرع بـ "الاستخدام العادل" بموجب القانون الأمريكي: فهي تجادل بأن التدريب "تحويلي" ولا يحل محل السوق الأصلي. لكن العديد من المحاكم تتحدى هذا التفسير.
رفضت القاضية كاثرين فورست، في قضية جيتي ضد ستابليستري للذكاء الاصطناعي، طلب رد الدعوى في يناير 2024، وسمحت بمتابعة القضية: "إن مسألة ما إذا كان تدريب نماذج الذكاء الاصطناعي يشكل استخدامًا عادلاً معقدًا ويتطلب فحصًا دقيقًا للوقائع. الترجمة: لا يمكن لشركات الذكاء الاصطناعي أن تتذرع ببساطة بالاستخدام العادل وتنتهي من الأمر.
في مواجهة الضغوط القانونية، بدأت شركات الذكاء الاصطناعي في التفاوض على التراخيص. أبرمت OpenAI اتفاقيات مع:
وقعت Google اتفاقيات مماثلة مع Reddit و Stack Overflow والعديد من الناشرين. تفاوضت أنثروبيك مع الناشرين لاستخدام الكتب.
لكن هذه الاتفاقيات لا تغطي سوى الناشرين الكبار الذين يتمتعون بقوة تفاوضية. فالملايين من المبدعين الأفراد - الفنانين والمصورين والكتاب المستقلين - لا يحصلون على تعويضات عن الأعمال المستخدمة في التدريب الذي تم الانتهاء منه بالفعل.
إن رواية "الذكاء الاصطناعي يتعلم مثل البشر" مضللة من الناحية التقنية. دعونا نلقي نظرة على الاختلافات الأساسية:
الحجم والسرعة: يدرس الفنان البشري ربما مئات أو آلاف الأعمال في حياته. تم تدريب GPT-4 على تريليونات الكلمات. الانتشار المستقر على مليارات الصور. المقياس لا يضاهى ويتجاوز أي تعريف معقول لـ "الإلهام".
الفهم الدلالي: عندما درس فان جوخ المطبوعات اليابانية، لم ينسخ الأنماط البصرية بشكل ميكانيكي، بل فهم المبادئ الجمالية الأساسية (استخدام الفضاء السلبي، والتكوين غير المتماثل، والتركيز على الطبيعة) وأعاد تفسيرها من خلال رؤيته الأوروبية ما بعد الانطباعية. أعماله هي توليفات ثقافية واعية.
نماذج الذكاء الاصطناعي لا "تفهم" بالمعنى البشري. كما تشرح ميلاني ميتشل، الأستاذة في معهد سانتا في، في كتابها "الذكاء الاصطناعي: دليل الإنسان المفكر": "تتفوق أنظمة التعلم العميق في التعرف على الأنماط ولكنها تفتقر إلى الفهم السببي أو التفكير المجرد أو النماذج الذهنية للعالم. فالانتشار المستقر لا "يفهم" ما الذي يجعل جيبلي مميزًا - فهو يستخرج الارتباطات الإحصائية بين ملايين البكسلات التي تحمل اسم "نمط جيبلي".
القصدية الإبداعية: يقوم الفنانون البشر بخيارات إبداعية مقصودة بناءً على الرؤية الشخصية، والرسالة التي يريدون إيصالها، والمشاعر التي يريدون إثارتها. يدمج ميازاكي مواضيع بيئية وسلمية ونسوية في أفلامه - خيارات أخلاقية وفنية واعية.
يقوم الذكاء الاصطناعي بالتوليد على أساس الاحتمالات الإحصائية: "بالنظر إلى الموجه X ومجموعة التدريب Y، ما هو تكوين البكسل الأكثر احتمالاً؟ لا توجد نية ولا رسالة ولا رؤية. وكما كتب تيد شيانغ في مجلة The New Yorker: "ChatGPT عبارة عن صورة ضبابية ضبابية للويب" - وهو ضغط ضائع يفقد بالضبط الصفات التي تجعل المحتوى الأصلي ذا قيمة.
التحويل مقابل إعادة التركيب: درس بابلو بيكاسو الأقنعة الأفريقية ولكنه ابتكر التكعيبية - وهي حركة فنية جديدة تمامًا أعادت ابتكار التمثيل المكاني في الرسم. كان التحوّل جذرياً وأصيلاً.
تعمل نماذج الذكاء الاصطناعي التوليدية عن طريق الاستيفاء في الفضاء الكامن: فهي تعيد تجميع عناصر مجموعة التدريب في تكوينات جديدة، ولكنها تظل مرتبطة بالتوزيع الإحصائي للبيانات التي تم تدريبها عليها. فهي لا تستطيع ابتكار جماليات جديدة حقاً تنتهك الانتظامات الإحصائية المكتسبة. وكما أوضح بحث معهد ماساتشوستس للتكنولوجيا (شومايلوف وآخرون، 2023)، فإن النماذج التي يتم تدريبها بشكل متكرر على مخرجات الذكاء الاصطناعي السابقة تتدهور تدريجيًا - وهي ظاهرة تسمى "انهيار النموذج".
هذه هي المفارقة المركزية: يمكن للذكاء الاصطناعي توليد مخرجات تبدو أصلية (لم يسبق لأي إنسان أن رأى صورة على غرار صورة جيبلي المحددة من قبل) ولكنها مشتقة إحصائيًا (فهي تحويرات لأنماط موجودة). إنه شكل سطحي من أشكال الأصالة دون ابتكار جوهري.
وهذا له آثار عميقة. كما جادل الفيلسوف جون سيرل في "حجة الغرفة الصينية" الشهيرة: محاكاة عملية إدراكية ليست مثل امتلاكها. يمكن للذكاء الاصطناعي أن يحاكي الإبداع دون أن يكون مبدعًا بالمعنى البشري للمصطلح.
في مواجهة هذا الجدل، يتم تطوير حلول مختلفة:
أدوات الحماية للفنانين:
سجلات إلغاء الاشتراك:
إطار التعويضات:
اللوائح الحكومية:
يتطلبقانون الاتحاد الأوروبي للذكاء الاصطناعي (الذي دخل حيز التنفيذ في أغسطس 2024) من مقدمي نماذج الذكاء الاصطناعي التوليدية نشر ملخصات مفصلة لبيانات التدريب المستخدمة المحمية بحقوق الطبع والنشر. إنها أول محاولة تنظيمية لفرض الشفافية.
يحمي قانون تينيسي ELVIS (مارس 2024) على وجه التحديد فناني الأداء الصوتي والشبيه من الاستخدام غير المصرح به في الولايات الأمريكية الأولى في مجال الذكاء الاصطناعي مع تشريع محدد لتزييف الصوت العميق والصورة.
تشمل المقترحات المقدمة للكونغرس الأمريكي طلبات التقيد الصريح بالمصنفات المحمية بحقوق الطبع والنشر (بدلاً من التقيد بعدم التقيد) وإنشاء سجلات عامة لمجموعات بيانات التدريب.
رؤيتان للمستقبل تواجهان بعضهما البعض:
وجهة نظر متفائلة (شركات الذكاء الاصطناعي): الذكاء الاصطناعي هو أداة تضخم الإبداع البشري، مثل الفوتوشوب أو آلات تركيب الموسيقى. سيستخدم الفنانون الذكاء الاصطناعي لتسريع سير العمل واستكشاف الاختلافات والتغلب على العوائق الإبداعية. ستظهر أشكال فنية هجينة حيث يوجه البشر الرؤية ويؤدي الذكاء الاصطناعي الأجزاء التقنية.
توجد أمثلة ملموسة بالفعل: استخدم فيلم "The Frost" (2023) الذكاء الاصطناعي لتوليد الخلفيات والتركيبات، مع وجود فنانين بشريين يوجهون الإخراج الفني. ويستخدم الموسيقيون "سونو" و"أوديو" لتوليد مقطوعات موسيقية للارتجال عليها. ويستخدم الكُتّاب GPT كـ "بطة مطاطية" لمناقشة الأفكار السردية.
وجهة نظر متشائمة (العديد من المبدعين): سيؤدي الذكاء الاصطناعي إلى تسليع الإبداع، مما سيؤدي إلى تآكل القيمة الاقتصادية للعمل الإبداعي حتى لا يبقى على قيد الحياة سوى النخب ذات المهارات الاستثنائية. سيتم استبدال "الإبداع المتوسط" بمولدات رخيصة الثمن، مما سيقضي على الطبقة الوسطى المبدعة - تمامًا كما قضت الأتمتة الصناعية على الحرفيين في القرن التاسع عشر.
تدعم الأدلة الأولية هذا القلق: على منصات العمل المستقل مثل Fiverr، انخفضت الطلبات على الرسامين ومؤلفي النصوص بنسبة 21% في عام 2023 (بيانات Fiverr للربع الرابع من عام 2023)، بينما انفجرت عروض "توليد فنون الذكاء الاصطناعي". وقد شهد غريغ روتكوفسكي انخفاضاً في العمولات المباشرة بنسبة 40% منذ أن أصبح أسلوبه شائعاً على موقع Stable Diffusion.
ربما تكمن الحقيقة في مكان ما بين هذا وذاك: بعض أشكال العمل الإبداعي ستكون مؤتمتة (الرسوم التوضيحية العامة للمخزون والتسويق الأساسي للنسخ)، بينما سيبقى الإبداع الأصلي والمفاهيمي والمتجذر ثقافياً مجالاً بشرياً.
ستزداد صعوبة التمييز بين المحتوى البشري ومحتوى الذكاء الاصطناعي. اليوم بالفعل، وبدون علامات مائية أو إفصاح، من المستحيل في كثير من الأحيان التمييز بين نص GPT-4 والنصوص البشرية، أو صور ميدجورني من الصور الفوتوغرافية. عندما يصبح Sora (مولد فيديو OpenAI) متاحًا للعامة سيمتد التمييز ليشمل الفيديو.
وهذا يثير أسئلة عميقة حول الأصالة. إذا كانت الصورة التي تم إنشاؤها بواسطة الذكاء الاصطناعي على غرار صورة جيبلي تثير نفس المشاعر التي تثيرها الصورة الأصلية، فهل لها نفس القيمة؟ لقد جادل الفيلسوف والتر بنيامين في كتابه "العمل الفني في عصر استنساخه التقني" (1935) بأن الاستنساخ الميكانيكي يضعف "هالة" العمل الأصلي - أي تفرده المكاني والزماني وأصالته.
ويأخذ الذكاء الاصطناعي التوليدي هذه الحجة إلى أقصى الحدود: فهو لا يعيد إنتاج الأعمال الموجودة ولكنه يولد تنويعات لا نهاية لها تحاكي الأصل دون أن تكون هي الأصل. إنه محاكاة بودرياردي - النسخة دون الأصل.
ومع ذلك، هناك شيء إنساني غير قابل للاختزال في الفعل الإبداعي الواعي: الفنان الذي يختار كل ضربة فرشاة وهو يعلم ما يريد إيصاله، والكاتب الذي يصوغ كل عبارة لإثارة مشاعر محددة، والملحن الذي يبني التوتر والدقة بقصد. يمكن للذكاء الاصطناعي محاكاة النتيجة ولكن ليس العملية - وربما تكمن القيمة الحقيقية للإبداع في العملية.
كما كتب ستوديو جيبلي في بيان (نوفمبر 2023): "لا تكمن روح أفلامنا في الأسلوب البصري الذي يمكن نسخه، بل في القرارات الإبداعية التي نتخذها إطارًا بإطار لخدمة القصة التي نريد سردها. وهذا لا يمكن أن يكون آلياً".
إن قيمة الفن، في نهاية المطاف، مستمدة من قدرته على التواصل بعمق مع التجربة الإنسانية - ليجعلنا نشعر بالفهم والتحدي والتحول. ويبقى سؤال ما إذا كان يمكن تحقيق ذلك بواسطة الذكاء الاصطناعي سؤالاً مفتوحاً. ولكن طالما أن الفن يصنعه البشر من أجل البشر، ويتحدث عن الحالة الإنسانية، فإنه سيحتفظ بشيء لا يمكن لأي خوارزمية أن تكرره: أصالة التجربة المعاشة المترجمة إلى شكل جمالي.
المصادر: