الإعلان عنالفراولة" من قبل OpenAI سلط الضوء على قصور أساسي في النماذج اللغوية: عدم قدرتها على تحليل الحروف الفردية داخل الكلمات. يكشف هذا الضعف عن جوانب عميقة حول كيفية عملها.
مشكلة العد
عندما يُطلب من ChatGPT عدّ حرف الراء في كلمة "فراولة"، غالبًا ما يخطئ النموذج في ذلك. لا ينبع هذا الخطأ من نقص في الذكاء، ولكن من الطريقة التي تحلل بها النماذج اللغوية النص. لفهم السبب، يحتاج المرء إلى معرفة مفهوم الترميز.
العالم يُرى من خلال الرموز
لا تنظر النماذج اللغوية إلى الكلمات على أنها تسلسل من الحروف، بل على أنها "رموز" - وحدات من المعنى محولة إلى أرقام. يشبه الأمر قراءة كتاب حيث يتم استبدال كل كلمة برمز رقمي. على سبيل المثال، تنقسم كلمة "كتب مدرسية" إلى رمزين منفصلين: "مدرسة" و"كتب". وهذا ما يفسر سبب صعوبة النموذج في حساب حرف الواو في هذه الكلمة بشكل صحيح - فهو لا يراها في الواقع كلمة واحدة.
مثال مضيء
تخيّل أن تتعلم لغة يتم فيها تمثيل كلمة "مدرسة" دائمًا بالرقم "412". إذا سألك شخص ما عن عدد حروف "o" في الرقم "412"، فلن نكون قادرين على الإجابة بشكل صحيح دون أن نرى الكلمة مكتوبة بالكامل. النماذج اللغوية في وضع مماثل: فهي تعالج المعاني من خلال الأرقام، دون الوصول إلى التركيب الحرفي للكلمات.
تحدي الكلمات المركبة
تصبح المشكلة أسوأ مع الكلمات المركبة. فكلمة "Timekeeper" مقسّمة إلى رموز منفصلة، مما يجعل من الصعب على النموذج تحديد الموضع الدقيق للحروف "و". لا يؤثر هذا التجزؤ على عد الحروف فحسب، بل يؤثر أيضًا على فهم بنية الكلمة الداخلية.
حل مشكلة الفراولة (ربما)
وينبغي أن يتغلب نموذج OpenAI المستقبلي على هذا القيد من خلال تقديم نهج مبتكر لمعالجة النصوص. فبدلاً من الاعتماد فقط على الترميز التقليدي، يجب أن يكون النموذج قادرًا على تحليل الكلمات على مستوى الحروف الفردية، مما يسمح بإجراء عمليات عد وتحليل أكثر دقة.
الآثار المترتبة في المستقبل
تتجاوز أهمية هذه المشكلة مجرد عدّ الحروف البسيط. يمكن لهذه القدرة التحليلية التفصيلية أن تحسّن بشكل كبير من الفهم اللغوي لنماذج الذكاء الاصطناعي، مما يمكّنها من معالجة المشاكل التي تتطلب تحليلاً مفصلاً للنص على مستوى الحروف.
سيكون التكامل المخطط له لهذه التقنية تقدمًا كبيرًا في اتجاه نماذج لغوية أكثر قدرة على "التفكير" في التفاصيل الأساسية للغة، وليس فقط الأنماط الإحصائية.