الشركة الناشئة للذكاء الاصطناعي أنثروبيك، اللي راعيها قوقل ومئات الملايين من رأس المال المخاطر، اليوم أعلنت عن أحدث إصدار من تقنيتها GenAI tech والشركة تدّعي إن بوت المحادثة الذكي يتفوق على شات جي بي تي 4 الصادر من شركة أوبن إيه آي فيما يخص الأداء
Claude 3، الاسم الجديد لتقنية GenAI من أنثروبيك، هو عائلة من النماذج ( كلود 3 هايكو، كلود 3 سونات وكلود 3 أوبوس ) وأوبوس هو الأقوى بينهم. كلها أظهرت “زيادة في القدرات” في التحليل والتنبؤ، فضلاً عن أداء محسَّن على اختبارات محددة مقارنة بنماذج مثل تشات جي بي تي وجي بي تي 4 وجميني 1.0 يولترا المُقدم من قوقل (لكن ما تفوق على جميني 1.5 برو).
الملاحظ أن كلود 3 هو أول GenAI متعدد الوسائط من شركة أنثروبيك، واللي معناه أنه يقدر يحلل النصوص فضلًا عن الصور – شبيه ببعض أنواع جي بي تي-4 و جميني. يقدر كلود 3 يعالج الصور والرسوم البيانية والرسوم البيانية والرسوم التخطيطية التقنية، اذا توفرله ملفات PDF أو باوبوينت أو أي أنواع أخرى من المستندات!
في خطوة أفضل من بعض منافسيها، تقدر التقنية الجديدة كلود 3 تحلل عدة صور في طلب واحد، توصل لـ 20 صورة. وهذا يسمح لها مقارنة الصور والتمييز بينها، مع ذلك في قيود كثيرة على معالجة الصور ..
الشركة ألغت قدرة التقنية على تحديد الهويات الشخصية – بلا شك خوفًا من التبعات الأخلاقية والقانونية – وتعترف الشركة أن كلود 3 عرضة للخطأ عند معالجة الصور “منخفضة الجودة” (أقل من 200 بكسل) ويواجه صعوبة في المهام المتضمنة للتفكير المكاني (على سبيل المثال قراءة عقارب الساعة) وكذلك عد الأشياء (كلود 3 غير قادر على إعطاء عدد دقيق للأشياء في الصور).

كلود 3 أيضًا ما يقدر يولّد أعمال فنية مثل MidJourny أو شات جي بي تي. التقنية تقتصر على تحليل الصور فقط – على الأقل في الوقت الحالي.
بغض النظر عن ما إذا التقنية تحلل النصوص أو الصور، يقدر المستخدمين بشكل عام يتوقعوا إن كلود 3 راح يتبع تعليمات فيها خطوات أكثر بشكل أفضل، ويتحدث بلغات أخرى غير الإنجليزية بشكل أفضل من البقية. راح يقلل كلود 3 من رفضه الإجابة على الأسئلة “فهمه للطلبات المعقدة سيكون أكبر”. وقريب راح تقوم التقنية الجديدة بتوضيح مصادر إجاباتها على الأسئلة عشان يقدر المستخدمين يتحققوا منها.
كلود 3 راح تدعم في البداية سياق نصي يتضمن 200,000 رمز = حوالي 150,000 كلمة، وبعض العملاء المختارين راح يحصلون على ميزة سياق نصي يصل إلى مليون رمز (~700,000 كلمة). وهذا يتماشى مع نموذج جوجل الجديد GenAI، اللي ذكرناه Gemini 1.5 Pro، واللي يقدم سياق نصي بنفس عدد الكلمات تقريبًا (مليون رمز)
لكن، كل اللي ذكرناه لا يعني ان التقنية الجديدة مثالية 😐
الشركة إعترفت إن كلود 3 مو معصوم من المشاكل اللي يعاني منها نماذج GenAI الأخرى، أشياء مثل التحيز والخداع (يعني اختلاق المعلومات). وعلى عكس بعض النماذج، كلود 3 ما يقدر يبحث على الإنترنت. لكنه يقدر يجيب على الأسئلة فقط باستخدام البيانات اللي اتدرب عليها قبل شهر أغسطس 2023، بمعنى انه ما عنده أي معلومات عن العالم بعد هذا التاريخ. وعلى الرغم من أن كلود 3 يدعم عدة لغات، إلا أنه ما قدر يوصل الإحترافية في اللغات الثانية مثل الإنجليزية.
لكن الشركة توعد بتحديثات متكررة لكلود 3 في الأشهر القادمة.
“نحن لا نعتقد أن ذكاء النموذج قد وصل إلى حدوده بأي شكل من الأشكال، ونخطط لإطلاق تحسينات على عائلة نماذج كلود 3 خلال الأشهر القليلة القادمة”
شركة أنثروبيك
تطمح الشركة لخلق خوارزمية الجيل القادم لـ “تعلم الذكاء الاصطناعي ذاتيًا”. يمكن استخدام مثل هذي الخوارزمية لبناء مساعدين افتراضيين يقدرون يردون على الرسائل الإلكترونية، وأداء البحوث، وإنتاج الفنون، والكتب، وغيرها – بعضها شفناها بالفعل من خلال GPT-4 ونماذج أخرى.
الشركة تلمح في مقالها، إنها قاعدة تخطط لإضافة ميزات لكلود 3 تعزز من قدراتها من خلال السماح لكلود بالتفاعل مع أنظمة ثانية، وكتابة الشفرات “بشكل تفاعلي”، وتوفير “قدرات وكالية متقدمة”.
هذا الجزء الأخير يذكرنا بطموحات شركة OpenAI المُعلنة لبناء وكيل برمجي ينجز بعض المهام المعقدة، مثل قدرته على نقل البيانات من مستند لجدول بيانات أو ملء تقارير المصاريف تلقائيًا وإدخالها في برامج المحاسبة بدون أي تدخل. وبالفعل، قدمت لنا OpenAI واجهة برمجة تطبيقات (API) تسمح للمطورين بناء “تجارب شبيهة بالوكيل” داخل تطبيقاتهم، والظاهر إن أنثروبيك قررت تقديم ميزات قابلة للمنافسة.
هل راح نشوف مُولِّد صور من أنثروبيك في المستقبل؟ مُولِّدات الصور هي موضوع جدل كبير في هذه الأيام، بشكل رئيسي لأسباب تتعلق بحقوق التأليف وغيرها. أجُبرت قوقل مؤخرًا على تعطيل مولد صورها بعد ما خورازمياتها ولدت صور بطريقة تافهة بدون احترام للسياق التاريخي، مثل توليد شكل المغول والاوروبيين القدماء ببشرة داكنة، وتواجه مشكلة ثانية مع الفنانين اللي خاضوا معارك قانونية متهمين مولدات الصور بالذكاء الاصطناعي لأنهم يتهمون النماذج بالاستفادة من أعمالهم عن طريق تدريب التقنيات على أعمالهم بدون أي مقابل أو حتى اعطائهم حقوق الملكية الفكرية حقتهم.
في النهاية دائمًا يكون في فائز واحد أو اثنين، هل راح تستمر شركة أنثروبيك في منافسة عمالقة مثل أوبن إيه آي وقوقل ومايكروسوفت ؟خصوصًا مع وجود أفضلية لكل واحد منهم سواء بالدعم المالي أو البيانات وحتى التسويق والشهرة، معارك الذكاء الإصطناعي دائمًا قصيرة، يعتمد فيها المتقدم على السرعة في التطوير والتنفيذ، وهذا أكبر عامل راح يحدد مين راح ياخذ السوق.