يمثل تاريخ مساعدي الذكاء الاصطناعيتطوراً ملحوظاً من أنظمة بسيطة قائمة على القواعد إلى شركاء محادثة متطورة قادرة على دعم القرارات الاستراتيجية المعقدة. ومع تزايد عدد المؤسسات التي تستخدم هذه المساعدين لتحسين الإنتاجية وعمليات اتخاذ القرارات، فإن فهم هذا التطور يوفر سياقاً قيماً لتسخير هذه التقنيات بفعالية.
ووفقًا لبحث أجراه الأمين وآخرون (2023)، فإن الأساس النظري الأول لروبوتات الدردشة الآلية المستقبلية يعود إلى عام 1906، عندما طور عالم الرياضيات الروسي أندريه ماركوف"سلسلة ماركوف"، وهو نموذج إحصائي أساسي للتنبؤ بالتسلسلات العشوائية. هذه الطريقة، على الرغم من بدائيتها مقارنةً بالتقنيات الحالية، إلا أنها مثلت الخطوة الأولى في تعليم الآلات توليد نصوص جديدة بطريقة احتمالية.
كانت اللحظة الحاسمة في تاريخ الذكاء الاصطناعي التخاطبي هي نشر مقالألان تورينج بعنوان "آلات الحوسبة والذكاء" في عام 1950، حيث اقترح ما نعرفه اليوم باسم "اختبار تورينج". يقيّم هذا الاختبار قدرة الآلة على إظهار سلوك ذكي لا يمكن تمييزه عن السلوك البشري من خلال المحادثات اللغوية الطبيعية.
كان أول روبوت دردشة آلي (ELIZA) المعترف به على نطاق واسع هو ELIZA، الذي طوره جوزيف وايزنباوم في معهد ماساتشوستس للتكنولوجيا في عام 1966. كما أشار الأمين وآخرون (2023)، قام ELIZA بمحاكاة معالج نفسي باستخدام تقنيات بسيطة لمطابقة الأنماط، مما يعكس ردود المستخدم لمحاكاة محادثة. على الرغم من بساطته، إلا أن العديد من المستخدمين أرجعوا فهم النظام إلى أنه يشبه الإنسان.
على عكس ELIZA، قام برنامج PARRY (الذي طوّره الطبيب النفسي كينيث كولبي في جامعة ستانفورد عام 1972) بمحاكاة مريض مصاب بالفصام بجنون العظمة. كان أول روبوت دردشة آلي يخضع لنسخة من اختبار تورينج، مما يمثل بداية استخدام هذه الاختبارات لتقييم ذكاء المحادثة لدى روبوتات الدردشة.
شهد عقد الثمانينيات ظهور برنامج Racter (1983)، القادر على توليد نصوص إبداعية باستخدام القواعد النحوية والعشوائية، تلاه برنامج JABBERWACKY (1988) وبرنامج TINYMUD (1989)، اللذان مثّلا خطوات أخرى إلى الأمام في محاكاة المحادثات الطبيعية.
تم إحراز تقدم كبير مع ALICE (الكيان اللغوي الاصطناعي للحاسوب على الإنترنت)، الذي طوره ريتشارد والاس في عام 1995. استخدم ALICE لغة ترميز الذكاء الاصطناعي (AIML)، والتي تم إنشاؤها خصيصًا لنمذجة اللغة الطبيعية في التفاعلات بين الإنسان والروبوتات.
شهدت الفترة ما بين عامي 2000 و2015 تطبيق تقنيات إحصائية أكثر تقدماً في مجال معالجة اللغات الطبيعية والتي حسّنت بشكل كبير من فهم اللغة:
كانت SmarterChild، التي طورتها شركة ActiveBuddy في عام 2001، واحدة من أوائل روبوتات الدردشة الآلية المدمجة في منصات المراسلة الفورية، حيث وصلت إلى أكثر من 30 مليون مستخدم.
وضع مشروع "CALO" (المساعد الإدراكي الذي يتعلم وينظم)، الذي أطلقته وكالة مشاريع البحوث الدفاعية المتقدمة (DARPA) في عام 2003، الأساس لـ Siri، الذي استحوذت عليه شركة Apple وأطلقته في عام 2011 كمساعد افتراضي في هاتف iPhone 4S. كما أشار الأمين وآخرون (2023)، مثّل سيري طفرة كبيرة في دمج المساعد الصوتي في أجهزة المستهلكين، باستخدام الشبكات العصبية العميقة لمعالجة الأوامر الصوتية وفهمها.

وصل تطور Siri* إلى مرحلة جديدة مع دمج نماذج الذكاء الاصطناعي المتقدمة التي أحدثت ثورة في قدراته. وفقاً للأمين وآخرون (2023)، تستفيد هذه النسخة الجديدة المحسّنة من Siri من بنى عصبية أكثر تطوراً لفهم سياق المحادثة بطريقة أعمق، مع الحفاظ على ذاكرة التفاعلات السابقة والتكيف مع التفضيلات الفردية للمستخدم. يمكن للمساعد الآن فهم الطلبات المعقدة والمتعددة الأدوار بفهم سياقي أكثر ثراءً مما يسمح بتفاعلات أكثر طبيعية وأقل تجزئة. ويمثل هذا التكامل خطوة مهمة نحو مساعدين افتراضيين قادرين على دعم المحادثات ثنائية الاتجاه حقاً.
يمثل Alexa+ تطورًا جذريًا في نظام أمازون البيئي، حيث يحول المساعد الصوتي إلى منصة ذكاء اصطناعي منزلية شاملة. يسلط الأمين وآخرون (2023) الضوء على أن نظام Alexa+ لم يعد يقتصر على الاستجابة لأوامر محددة، بل أصبح الآن قادرًا على توقع احتياجات المستخدم من خلال دمج النماذج التنبؤية المتقدمة. يمكن للنظام تنسيق الأجهزة المنزلية الذكية بشكل مستقل، واقتراح عمليات أتمتة مخصصة بناءً على الأنماط السلوكية المكتشفة، وتسهيل المزيد من التفاعلات الطبيعية من خلال الفهم السياقي المحسّن. Among the most significant innovations, Alexa+ can now perform complex multi-step tasks without the need for repeated activations, maintaining context through long sequences of interactions.
وقد قدم مساعد كورتانا من مايكروسوفت (الذي أصبح الآن كوبيلوت)، الذي تم إطلاقه في عام 2014، قدرات التعرف على الكلام لمهام مثل إعداد التذكير، بينما أظهر مساعد واتسون من شركة آي بي إم قدرات متقدمة في فهم اللغة وتحليلها، وفاز في مسابقة Jeopardy! في عام 2011 ووجد بعد ذلك تطبيقات في مختلف الصناعات.
.png)
يسلط البحث الذي أجراه الأمين وآخرون (2023) الضوء على كيف أن تقديم OpenAI لنموذج GPT ChatGPT يمثل طفرة أساسية. بدءاً من GPT-1 (2018) مع 117 مليون معلمة، وصولاً إلى GPT-3 (2020) مع 175 مليار معلمة، تستخدم هذه النماذج بنية المحول لفهم وإنشاء نص بقدرات غير مسبوقة. كان الإصدار العام لـ ChatGPT في نوفمبر 2022 بمثابة لحظة حاسمة في إمكانية الوصول إلى الذكاء الاصطناعي التخاطبي.
وكرد فعل على ChatGPT، أطلقت Google برنامج Bard (الآن Gemini) في عام 2023، استنادًا إلى نموذجها LaMDA (نموذج اللغة لتطبيقات الحوار). يشير الأمين وآخرون (2023) إلى أن Bard استخدم نهجًا تدريجيًا، حيث أضافوا تدريجيًا ميزات مثل القدرة على تعدد اللغات والمهارات المهنية في البرمجة والرياضيات.
بالنظر إلى المستقبل، يتطور مساعدو الذكاء الاصطناعي نحو أشكال أكثر تقدماً من الذكاء التعاوني. يحدد البحث الذي أجراه الأمين وآخرون (2023) عدة مجالات واعدة للتطوير:
علاوة على ذلك، يسلط البحث الضوء على التوسع في استخدام مساعدي الذكاء الاصطناعي في قطاعات محددة:
يمثل التطور من مجرد روبوتات الدردشة الآلية البسيطة إلى شركاء الذكاء الاصطناعي الاستراتيجيين أحد أهم التحولات التكنولوجية في عصرنا الحالي. وقد كان هذا التطور مدفوعاً بقوى علمية متعددة التخصصات والتطبيقات التجارية واحتياجات المستخدمين. ويؤدي دمج النماذج التأسيسية المتقدمة في الأنظمة المساعدة مثل Siri وAlexa+ إلى تسريع هذا التحول، مما يؤدي إلى تجارب شخصية وسياقية بشكل متزايد. ومع ازدياد تأثير هذه الأنظمة، يصبح التطوير المسؤول والشفاف الذي يوازن بين الابتكار والاعتبارات الأخلاقية أمراً بالغ الأهمية.
ملاحظة محدثة (نوفمبر 2025): لم يتم إصدار الإصدار المتقدم من Siri المزود بذكاء Apple الموصوف في المقال حتى الآن. فقد أجّلت Apple الإصدار من ربيع 2025 إلى ربيع 2026 (iOS 26.4) وأعلنت عن شراكة مع Google لاستخدام Gemini كنموذج أساسي لأجزاء رئيسية من Siri الجديد. لا تزال الميزات المتقدمة - السياق الشخصي، والفهم على الشاشة وتكامل التطبيقات - قيد التطوير، مع توفر تحسينات تدريجية فقط مع الإصدار 26 من نظام التشغيل iOS 26.