الأعمال التجارية

ما وراء الخوارزمية: كيف يتم تدريب نماذج الذكاء الاصطناعي وصقلها

"البيانات هي المفتاح. إنها الكأس المقدسة للذكاء الاصطناعي التوليدي." - هيلاري باكر، الرئيس التنفيذي للتكنولوجيا في أمريكان إكسبريس. يمثل استخلاص البيانات 80% من الجهد المبذول في مشاريع الذكاء الاصطناعي. لقد غيرت DeepSeek القواعد: تكلفة الاستدلال 1/30 مقارنةً بـ OpenAI. داريو أمودي: تنخفض التكاليف 4 أضعاف في السنة. "أتوقع أن تنخفض التكلفة إلى الصفر" - المدير التنفيذي لشركة Intuit. إن الجمع بين التقطير + RAG هو المكان الذي يكمن فيه السحر بالنسبة لمعظم الشركات. المستقبل؟ كتل من النماذج المحددة وغير المكلفة المتجذرة في بيانات الشركة.

كيفية تدريب نموذج ذكاء اصطناعي

يمثل تدريب نماذج الذكاء الاصطناعي أحد أكثر التحديات تعقيداً في التطور التكنولوجي المعاصر. فهو أكثر بكثير من مجرد مسألة خوارزمية بسيطة، إذ يتطلب التدريب الفعال للنموذج نهجًا منهجيًا ومتعدد التخصصات يدمج البيانات وعلوم البيانات والمعرفة بالمجال وهندسة البرمجيات. وكما يشير جيمس لوك في نصه الأساسي"ما وراء الخوارزميات: تقديم الذكاء الاصطناعي للأعمال"، فإن نجاح تطبيق الذكاء الاصطناعي يعتمد على إدارة البيانات والتصميم المنهجي أكثر بكثير من اعتماده على الخوارزميات نفسها. يتغير المشهد بسرعة، مع ابتكارات مثل نموذج DeepSeek-R1 الذي يعيد تعريف التكلفة وإمكانية الوصول.

الأساس: جمع البيانات وإدارتها

الجودة بدلاً من الكمية

على عكس ما يُعتقد في كثير من الأحيان، فإن كمية البيانات ليست دائمًا العامل المحدد للنجاح. فجودة البيانات وطابعها التمثيلي أكثر أهمية بكثير. وفي هذا السياق، من الأهمية بمكان دمج المصادر المختلفة:

  • بيانات الملكية: البيانات المملوكة: تم جمعها بشكل أخلاقي ومجهولة المصدر من خلال التطبيقات الحالية
  • بيانات معتمدة: يتم الحصول عليها من موردين موثوقين يستوفون معايير الجودة الصارمة
  • مجموعات البيانات مفتوحة المصدر: تم التحقق منها بعناية لضمان التنوع والدقة
  • البيانات التركيبية: بيانات اصطناعية: يتم توليدها بشكل مصطنع لسد الثغرات وحل مشاكل الخصوصية

ويؤدي هذا التكامل إلى إنشاء قاعدة تدريب شاملة تجسد سيناريوهات العالم الحقيقي مع الحفاظ على المعايير الأخلاقية والخصوصية.

تحدي إعداد البيانات

تمثل عملية "معالجة البيانات" ما يصل إلى 80% من الجهد المطلوب في مشاريع الذكاء الاصطناعي. وتتضمن هذه المرحلة:

  • تنظيف البيانات: التخلص من التناقضات والتكرارات والقيم المتطرفة
  • تحويل البيانات: التحويل إلى تنسيقات مناسبة للمعالجة
  • تكامل البيانات: دمج المصادر المختلفة التي غالبًا ما تستخدم مخططات وتنسيقات غير متوافقة
  • التعامل مع البيانات المفقودة: استراتيجيات مثل التضمين الإحصائي أو استخدام البيانات البديلة

كما أشار هيلاري باكر، الرئيس التنفيذي للتكنولوجيا في أمريكان إكسبريس: "كانت اللحظة الفارقة بالنسبة لنا، بصراحة، هي البيانات. يمكنك اختيار أفضل نموذج في العالم... ولكن البيانات هي المفتاح. التحقق والدقة هما الكأس المقدسة الآن في مجال الذكاء الاصطناعي التوليدي."

بنية النموذج: الحجم المناسب

يجب أن يسترشد اختيار بنية النموذج بالطبيعة المحددة للمشكلة المراد حلها، وليس بالميول أو التفضيلات الشخصية. فالأنواع المختلفة من المشاكل تتطلب نهوجاً مختلفة:

  • نماذج اللغة القائمة على المحولات للمهام التي تتطلب فهمًا لغويًا عميقًا
  • الشبكات العصبية التلافيفية للتعرف على الصور والأنماط
  • الشبكات العصبية البيانيةلتحليل العلاقات المعقدة بين الكيانات
  • التعلّم المعزز لمشاكل التحسين واتخاذ القرارات
  • البنى الهجينة التي تجمع بين مناهج متعددة لحالات الاستخدام المعقدة

يتطلب التحسين المعماري إجراء تقييم منهجي بين التكوينات المختلفة، مع التركيز على الموازنة بين الأداء والمتطلبات الحاسوبية، وهو جانب أصبح أكثر أهمية مع ظهور نماذج مثل DeepSeek-R1 التي توفر قدرات تفكير متقدمة بتكاليف أقل بكثير.

منهجيات التدريب المتقدم

التقطير النموذجي

برزت عملية التقطير كأداة قوية بشكل خاص في منظومة الذكاء الاصطناعي الحالية. هذه العملية تجعل من الممكن إنشاء نماذج أصغر حجماً وأكثر تحديداً ترث القدرات المنطقية للنماذج الأكبر والأكثر تعقيداً، مثل DeepSeek-R1.

كما هو موضح في حالة DeepSeek، قامتالشركة بتقطير قدرات الاستدلال الخاصة بها على عدة نماذج أصغر، بما في ذلك النماذج مفتوحة المصدر من عائلة Llama من Meta وعائلة Qwen من Alibaba. يمكن بعد ذلك تحسين هذه النماذج الأصغر حجماً لمهام محددة، مما يسرع من الاتجاه نحو النماذج السريعة والمتخصصة.

يقول سام ويتفين، مطور التعلم الآلي: "لقد بدأنا في الدخول إلى عالم يستخدم فيه الأشخاص نماذج متعددة. فهم لا يستخدمون نموذجًا واحدًا فقط طوال الوقت." ويشمل ذلك النماذج المغلقة منخفضة التكلفة مثل Gemini Flash و GPT-4o Mini، والتي "تعمل بشكل جيد للغاية في 80 في المائة من حالات الاستخدام".

التعلم متعدد المهام

بدلاً من تدريب نماذج منفصلة للمهارات ذات الصلة، يسمح التعلم متعدد المهام للنماذج بمشاركة المعرفة بين الوظائف المختلفة:

  • تعمل النماذج على تحسين النماذج في نفس الوقت لتحقيق عدة أهداف ذات صلة
  • تستفيد الوظائف الأساسية من التعرض الأوسع للمهام المختلفة
  • يتحسن الأداء في جميع المهام، خاصة تلك ذات البيانات المحدودة
  • زيادة الكفاءة الحسابية من خلال مشاركة المكونات

الضبط الدقيق الخاضع للإشراف (SFT)

بالنسبة للشركات التي تعمل في مجالات محددة للغاية، حيث لا تتوفر المعلومات على نطاق واسع على شبكة الإنترنت أو في الكتب المستخدمة عادةً لتدريب النماذج اللغوية، فإن الضبط الدقيق تحت الإشراف (SFT) يعد خيارًا فعالاً.

أظهر DeepSeek أنه من الممكن تحقيق نتائج جيدة باستخدام "الآلاف" من مجموعات بيانات الأسئلة والأجوبة. على سبيل المثال، أظهر مهندس شركة IBM كريس هاي كيف قام بإعداد نموذج صغير باستخدام مجموعات البيانات الخاصة بالرياضيات الخاصة به وحصل على إجابات سريعة للغاية تجاوزت أداء نموذج o1 الخاص بـ OpenAI على نفس المهام.

التعلُّم المعزز (RL)

الشركات التي ترغب في تدريب نموذج مع مزيد من المواءمة مع تفضيلات محددة - على سبيل المثال، جعل روبوت الدردشة الآلي الخاص بدعم العملاء متعاطفًا وموجزًا - ستحتاج إلى تطبيق تقنيات التعلم المعزز (RL). هذا النهج مفيد بشكل خاص إذا أرادت الشركة أن يقوم روبوت الدردشة الآلي الخاص بها بتكييف أسلوبه وتوصياته بناءً على ملاحظات المستخدمين.

الاسترجاع-التوليد المعزز (RAG)

بالنسبة لمعظم الشركات، يعتبر التوليد المعزز للاسترجاع (RAG) أبسط الطرق وأكثرها أمانًا. إنها عملية مباشرة نسبيًا تسمح للمؤسسات بتثبيت نماذجها بالبيانات الخاصة الموجودة في قواعد بياناتها، مما يضمن دقة المخرجات وملاءمتها للمجال.

يساعد هذا النهج أيضاً على مواجهة بعض مشاكل الهلوسة المرتبطة بنماذج مثل DeepSeek، والتي تهلوس حالياً في 14% من الحالات مقارنة بـ 8% لنموذج o3 الخاص بـ OpenAI، وفقاً لدراسة أجرتها شركة Vectara.

يكمن السحر في الجمع بين تقطير النماذج و RAG بالنسبة لمعظم الشركات، حيث أصبح من السهل جدًا تطبيقه، حتى بالنسبة لأولئك الذين لديهم مهارات محدودة في علم البيانات أو البرمجة.

التقييم والتنقيح: ما وراء مقاييس الدقة

لا يقاس الذكاء الاصطناعي الفعال من حيث الدقة الأولية فحسب، بل يتطلب إطار تقييم شامل يأخذ في الاعتبار:

  • الدقة الوظيفية: التردد الذي ينتج به النموذج نتائج صحيحة
  • المتانة: اتساق الأداء مع اختلاف المدخلات والظروف
  • الإنصاف: أداء متسق عبر مجموعات المستخدمين والسيناريوهات المختلفة
  • المعايرة: المواءمة بين درجات الثقة والدقة الفعلية
  • الكفاءة: المتطلبات الحسابية ومتطلبات الذاكرة
  • قابلية الشرح: شفافية عمليات اتخاذ القرار، وهو جانب تتفوق فيه نماذج DeepSeek المقطرة، حيث تُظهر عملية التفكير المنطقي

تأثير منحنى التكلفة

يتمثل التأثير الأكثر فورية لإصدار DeepSeek في انخفاض أسعاره بشكل كبير. فقد توقعت صناعة التكنولوجيا أن تنخفض التكاليف بمرور الوقت، لكن القليلين توقعوا مدى سرعة حدوث ذلك. فقد أظهر DeepSeek أن النماذج القوية والمفتوحة يمكن أن تكون رخيصة وفعالة في الوقت نفسه، مما يخلق فرصاً للتجريب على نطاق واسع والتنفيذ الفعال من حيث التكلفة.

وقد أكد عمرو عوض الله، الرئيس التنفيذي لشركة فيكتارا، على هذه النقطة، مشيراً إلى أن نقطة التحول الحقيقية ليست فقط تكلفة التدريب، بل تكلفة الاستدلال، والتي تبلغ بالنسبة لـ DeepSeek حوالي 1/30 من تكلفة نماذج OpenAI o1 أو o3 لكل رمز. وقال عوض الله: "إن الهوامش التي تمكنت OpenAI وAthropic وGoogle Gemini من الحصول عليها يجب أن تنخفض الآن بنسبة 90 في المائة على الأقل لأنها لا تستطيع أن تظل قادرة على المنافسة بهذه الأسعار المرتفعة".

ليس هذا فحسب، بل ستستمر هذه التكاليف في الانخفاض. فقد ذكر داريو أمودي الرئيس التنفيذي لشركة أنثروبيك مؤخرًا أن تكلفة تطوير النماذج تستمر في الانخفاض بمعدل أربعة أضعاف كل عام تقريبًا. ونتيجة لذلك، سيستمر أيضًا انخفاض المعدل الذي يتقاضاه موردو نماذج LLM مقابل استخدامها.

"قال أشوك سريفاستافا، الرئيس التنفيذي للعمليات في شركة Intuit، وهي شركة دفعت بقوة بالذكاء الاصطناعي في عروضها من برامج الضرائب والمحاسبة مثل TurboTax وQuickbooks: "أتوقع تمامًا أن تصل التكلفة إلى الصفر. "... وسيصل زمن الاستجابة إلى الصفر. ستصبح ببساطة قدرات أساسية يمكننا استخدامها."

الخلاصة: مستقبل الذكاء الاصطناعي للمؤسسات مفتوح ورخيص وقائم على البيانات

إن "DeepSeek" و"Deep Research" من OpenAI أكثر من مجرد أدوات جديدة في ترسانة الذكاء الاصطناعي، بل هي علامات على تغيير عميق ستنشر فيه الشركات أعداداً كبيرة من النماذج المصممة لهذا الغرض، والتي تتسم بالفعالية من حيث التكلفة والكفاءة العالية والمتجذرة في بيانات الشركة ونهجها.

بالنسبة للشركات، الرسالة واضحة: الأدوات اللازمة لبناء تطبيقات ذكاء اصطناعي قوية خاصة بمجال معين في متناول اليد. أنت تخاطر بالتخلف عن الركب إذا لم تستفد من هذه الأدوات. ولكن النجاح الحقيقي سيأتي من كيفية تنظيم البيانات، واستغلال تقنيات مثل RAG والتقطير، والابتكار لما بعد مرحلة ما قبل التدريب.

وكما قال باكر من AmEx: الشركات التي تدير بياناتها بشكل صحيح هي التي ستقود الموجة التالية من الابتكار في مجال الذكاء الاصطناعي.

موارد لنمو الأعمال التجارية

9 نوفمبر 2025

لماذا الرياضيات صعبة (حتى لو كنت من الذكاء الاصطناعي)

النماذج اللغوية لا تعرف كيف تضاعف حفظ النتائج بالطريقة التي نحفظ بها الباي (pi)، ولكن هذا لا يجعلها رياضيات. المشكلة هيكلية: فهي تتعلم عن طريق التشابه الإحصائي، وليس عن طريق الفهم الخوارزمي. حتى "النماذج المنطقية" الجديدة مثل o1 تفشل في المهام التافهة: فهي تحسب بشكل صحيح حرف "r" في كلمة "فراولة" بعد ثوانٍ من المعالجة، ولكنها تفشل عندما يتعين عليها كتابة فقرة حيث يشكل الحرف الثاني من كل جملة كلمة. يستغرق الإصدار المميز الذي تبلغ تكلفته 200 دولار شهرياً أربع دقائق لحل ما يقوم به الطفل على الفور. لا يزال DeepSeek و Mistral في عام 2025 يخطئان في عد الحروف. الحل الناشئ؟ نهج هجين - لقد اكتشفت أذكى النماذج متى تستدعي آلة حاسبة حقيقية بدلاً من محاولة إجراء العملية الحسابية بنفسها. نقلة نوعية: ليس من الضروري أن يعرف الذكاء الاصطناعي كيفية القيام بكل شيء ولكن يجب أن ينظم الأدوات الصحيحة. مفارقة أخيرة: يمكن لـ GPT-4 أن يشرح لك ببراعة نظرية النهايات ولكنه يخطئ في عمليات الضرب التي تحلّها آلة حاسبة الجيب بشكل صحيح دائماً. بالنسبة لتعليم الرياضيات فهي ممتازة - تشرح بصبر لا متناهٍ، وتكيّف الأمثلة، وتحلل المنطق المعقد. للعمليات الحسابية الدقيقة؟ اعتمد على الآلة الحاسبة، وليس على الذكاء الاصطناعي.
9 نوفمبر 2025

تنظيم الذكاء الاصطناعي لتطبيقات المستهلك: كيفية الاستعداد للوائح الجديدة لعام 2025

يمثل عام 2025 نهاية حقبة "الغرب المتوحش" للذكاء الاصطناعي: قانون الذكاء الاصطناعي في الاتحاد الأوروبي الذي يبدأ العمل به اعتبارًا من أغسطس 2024 مع التزامات محو أمية الذكاء الاصطناعي اعتبارًا من 2 فبراير 2025، والحوكمة ومبادرة الحوكمة العالمية للذكاء الاصطناعي اعتبارًا من 2 أغسطس. كاليفورنيا رائدة من خلال SB 243 (وُلدت بعد انتحار سيويل سيتزر، طفل يبلغ من العمر 14 عامًا طور علاقة عاطفية مع روبوت الدردشة) يفرض حظرًا على أنظمة المكافأة القهرية، والكشف عن التفكير في الانتحار، والتذكير كل 3 ساعات "أنا لست إنسانًا"، والتدقيق العام المستقل، وعقوبات بقيمة 1000 دولار/مخالفة. يتطلب SB 420 تقييمات الأثر لـ "القرارات المؤتمتة عالية الخطورة" مع حقوق استئناف المراجعة البشرية. الإنفاذ الفعلي: تم الاستشهاد بنوم 2022 عن الروبوتات التي تم تمريرها كمدربين بشريين، تسوية 56 مليون دولار. الاتجاه الوطني: ألاباما وهاواي وإلينوي وماين وماساتشوستس تصنف الفشل في إخطار روبوتات الدردشة الآلية التي تعمل بالذكاء الاصطناعي على أنه انتهاك لقانون UDAP. نهج الأنظمة ذات المخاطر الحرجة ثلاثي المستويات (الرعاية الصحية/النقل/الطاقة) اعتماد ما قبل النشر، والإفصاح الشفاف الذي يواجه المستهلك، والتسجيل للأغراض العامة + اختبار الأمان. الترقيع التنظيمي بدون استباق فيدرالي: يجب على الشركات متعددة الولايات التنقل بين المتطلبات المتغيرة. الاتحاد الأوروبي اعتبارًا من أغسطس 2026: إبلاغ المستخدمين بالتفاعل مع الذكاء الاصطناعي ما لم يكن واضحًا، والمحتوى الذي يتم إنشاؤه بواسطة الذكاء الاصطناعي مصنفًا على أنه قابل للقراءة آليًا.
9 نوفمبر 2025

تنظيم ما لم يتم إنشاؤه: هل تخاطر أوروبا بعدم ملاءمة التكنولوجيا؟

تجتذب أوروبا عُشر الاستثمارات العالمية في مجال الذكاء الاصطناعي ولكنها تدعي أنها تملي القواعد العالمية. هذا هو "تأثير بروكسل" - فرض القواعد على نطاق الكوكب من خلال قوة السوق دون دفع الابتكار. يدخل قانون الذكاء الاصطناعي حيز التنفيذ وفق جدول زمني متدرج حتى عام 2027، لكن شركات التكنولوجيا متعددة الجنسيات تستجيب باستراتيجيات تهرب مبتكرة: التذرع بالأسرار التجارية لتجنب الكشف عن بيانات التدريب، وإنتاج ملخصات متوافقة تقنياً ولكنها غير مفهومة، واستخدام التقييم الذاتي لخفض مستوى الأنظمة من "عالية المخاطر" إلى "قليلة المخاطر"، والتسوق من خلال اختيار الدول الأعضاء ذات الضوابط الأقل صرامة. مفارقة حقوق النشر خارج الحدود الإقليمية: يطالب الاتحاد الأوروبي بأن تمتثل OpenAI للقوانين الأوروبية حتى بالنسبة للتدريب خارج أوروبا - وهو مبدأ لم يسبق له مثيل في القانون الدولي. ظهور "النموذج المزدوج": إصدارات أوروبية محدودة مقابل إصدارات عالمية متقدمة من منتجات الذكاء الاصطناعي نفسها. الخطر الحقيقي: أن تصبح أوروبا "قلعة رقمية" معزولة عن الابتكار العالمي، مع وصول المواطنين الأوروبيين إلى تقنيات أقل شأناً. لقد رفضت محكمة العدل في قضية تسجيل الائتمان بالفعل دفاع "الأسرار التجارية"، ولكن لا يزال عدم اليقين التفسيري هائلاً - ماذا يعني بالضبط "ملخص مفصل بما فيه الكفاية"؟ لا أحد يعرف. السؤال الأخير الذي لم تتم الإجابة عليه: هل يخلق الاتحاد الأوروبي طريقًا ثالثًا أخلاقيًا بين الرأسمالية الأمريكية وسيطرة الدولة الصينية، أم أنه ببساطة يصدّر البيروقراطية إلى مجال لا ينافسه فيه أحد؟ في الوقت الحالي: رائد عالمي في تنظيم الذكاء الاصطناعي، وهامشي في تطويره. برنامج واسع.