أشياء تحتاج إلى معرفتها حول طراز OpenAI الجديد القوي o1

25 سبتمبر 2024

بعد أشهر من التكهنات، وصل برنامج "Strawberry" LLM من OpenAI أخيرًا، ولم يُطلق عليه اسم GPT-5. في الساعات الأولى من صباح الثالث عشر من سبتمبر، كشفت OpenAI عن سلسلة OpenAI o1، وهي نموذج لغوي ضخم يتمتع بقدرات استدلالية لا مثيل لها. يمثل هذا النموذج قفزة كبيرة إلى الأمام في الاستدلال المعقد، متجاوزًا حتى أداء الإنسان على مستوى الدكتوراه في بعض المجالات.

اتفاقية تسمية جديدة

الاسم نفسه أقل أهمية من التحول الذي يمثله. OpenAI o1 هو أول نموذج ينفصل عن عائلة "GPT"، مما يمثل بداية "نموذج استدلال" جديد يختلف عن "نموذج التدريب المسبق" لسابقاته. يوضح OpenAI: "يمثل الاستدلال حدودًا جديدة في قدرات AI. قررنا إعادة ضبط العداد إلى 1 وتسمية هذه السلسلة باسم OpenAI o1".

أصدرت OpenAI في وقت واحد نموذجين (o1-preview وo1-mini)، بالإضافة إلى أكثر من اثني عشر مقطع فيديو توضيحيًا وورقة بحثية شاملة مكونة من 43 صفحة. الميزة الأساسية هي وقت المداولة الممتد للنماذج قبل الاستجابة، مما يحاكي حل المشكلات البشرية. يرتبط وقت التفكير بشكل مباشر بالأداء في المهام المعقدة.

قدرات o1

سلسلة o1 هي أول نموذج مدرب على التعلم التعزيزي من OpenAI. وهي تولد سلسلة طويلة من الأفكار قبل الإجابة، مما يعزز قدراتها بشكل كبير. وتؤدي سلاسل الأفكار الأطول إلى مداولة أطول وأداء استدلالي محسّن.

$تقييمات المسابقات في الرياضيات (AIME 2024)، والترميز (CodeForces)، وأسئلة العلوم على مستوى الدكتوراه (GPQA Diamond)$

سلط الرئيس التنفيذي سام ألتمان الضوء على براعة o1: حيث سجلت نسخة معدلة بدقة بين أفضل 49% من المنافسين البشر في أولمبياد المعلوماتية الدولي لعام 2024 (IOI) بعد 50 محاولة لكل مشكلة.

كما حققت o1 أعلى أداء في اختبار 89% في البرمجة التنافسية لـ Codeforces واحتلت مرتبة بين أفضل 500 طالب أمريكي في امتحان الرياضيات الأمريكي (AIME). وبالمقارنة مع GPT-4، تُظهر o1 تحسنات كبيرة في مختلف المجالات، بما في ذلك مجالات العلوم والتكنولوجيا والهندسة والرياضيات والقانون والاقتصاد.

ماذا يمكن لـ o1 أن يفعل؟

يحتفظ o1 بتنوع نماذج GPT السابقة (الإجابة على الأسئلة، والتلخيص، وإنشاء المحتوى)، ولكن تفكيره المتقدم يجعله مناسبًا بشكل خاص لـ:

التفكير المتفوق: قوية بشكل خاص في مجالات العلوم والتكنولوجيا والهندسة والرياضيات.
حل المشكلات بطريقة إبداعية: ممتاز لتبادل الأفكار وتكوين الأفكار.
البحث العلمي: متمكن من مهام مثل شرح مجموعات البيانات المعقدة (على سبيل المثال، تسلسل الخلايا) والتعامل مع الصيغ الرياضية المعقدة (على سبيل المثال، في البصريات الكمومية).
كفاءة البرمجة: إنشاء كود فعال وتصحيح أخطائه ومساعدة سير العمل، مع أداء جيد في معايير مثل Human Eval وCodeforces.
الرياضيات المتقدمة: يتفوق بشكل كبير على النماذج السابقة في المعايير الرياضية، حيث يحقق دقة 83% في اختبار تأهيل IMO (مقارنة بـ 13% في GPT-4) ونتائج AIME قوية. قادر على توليد صيغ فيزيائية معقدة.
دقة محسنة: يتضمن التحقق الذاتي من الحقائق لتحسين الدقة.

قوة سلسلة الفكر

يستخدم نموذج o1 الخاص بـ OpenAI سلسلة من العمليات الفكرية لحل المشكلات، مما يعكس المداولات البشرية حول الأسئلة المعقدة. من خلال التعلم التعزيزي، يعمل o1 على تحسين استراتيجيات حل المشكلات، ويتعلم كيفية تحديد الأخطاء وتصحيحها، وتقسيم الخطوات المعقدة إلى خطوات أبسط، وحتى تبديل الأساليب عند الضرورة. تعمل هذه العملية التكرارية على تعزيز قدراته على التفكير بشكل كبير. فيما يلي أمثلة على سلسلة التفكير الخاصة بـ o1-preview حول المشكلات الصعبة لتوضيح هذا التقدم. يحاكي هذا النهج الإدراك البشري، مما يتيح التحسين التدريجي وحتى التكرار الذاتي داخل مشكلة واحدة، مما يؤدي إلى تحسين التفكير بشكل كبير.

إن زيادة التعلم التعزيزي أثناء التدريب وإطالة وقت التفكير أثناء الاختبار يعملان على تحسين أداء o1 بشكل أكبر، مما يؤدي إلى إرساء قانون جديد للتوسع. ومع ذلك، فإن قيود التوسع تختلف بشكل كبير عن تلك الخاصة بأساليب التدريب المسبق التقليدية، ويقوم OpenAI ببحث هذه الاختلافات بشكل نشط.

لتصور تفكير o1، ضع في اعتبارك سؤال فهم القراءة. في حين يوفر GPT-4 إجابة مباشرة، يكشف خيار "إظهار سلسلة الأفكار" في o1-preview عن تحليله خطوة بخطوة. فهو يفحص كل خيار بشكل منهجي، ويتساءل مرارًا وتكرارًا عن سببه ("هل هذا تفسير جيد؟"، "هل يقول الكاتب ذلك؟"، "هل يدعم السياق هذا؟")، ويصل في النهاية إلى الإجابة الصحيحة من خلال التحسين التكراري.

تتمتع سلسلة o1 بتطبيقات واسعة النطاق، حيث تساعد الباحثين في مجال الرعاية الصحية في شرح بيانات تسلسل الخلايا، والفيزيائيين في إنشاء صيغ بصرية كمية معقدة، والمطورين في بناء وتنفيذ تدفقات عمل متعددة الخطوات. وفي حين تتراوح أوقات التفكير الحالية من بضع ثوانٍ إلى عشرات الثواني، فإن التطوير المستقبلي لـ OpenAI يركز على زيادة وقت التفكير هذا وليس تقليله، بهدف إنشاء إصدارات مستقبلية قادرة على التفكير لساعات أو أيام أو حتى أسابيع. وهذا من شأنه أن يزيد التكاليف، ولكن إمكانية تحقيق تقدم كبير في مجالات مثل الطب تبرر الاستثمار. وتمتد قدرات AI إلى ما هو أبعد من مجرد برامج الدردشة البسيطة.

تنبيه: تجنب الاستعلام عن المنطق الداخلي لـ o1 في ChatGPT

بعد إطلاق o1، أبلغ العديد من المستخدمين عن تلقي تحذيرات، وحتى حظر مؤقت، لمحاولتهم الوصول إلى عملية التفكير الداخلي. وقد أثار هذا ردود فعل عنيفة.

لقد قام المستخدمون بتفعيل التحذيرات ببساطة عن طريق تضمين كلمات رئيسية مثل "تتبع المنطق" أو "إظهار سلسلة أفكارك" في مطالباتهم. حتى المحاولات غير المباشرة لاستنباط منطق النموذج من خلال صياغة بديلة تم اكتشافها ومعاقبتها. كان هدف هؤلاء المستخدمين هو استخراج عملية التفكير الداخلية الكاملة لـ o1 - المنطق الخام tokens - والتي يتم تلخيصها حاليًا في واجهة ChatGPT (يمكن الوصول إليها عبر زر التوسيع).

من المحتمل أن يكون السبب وراء القيود المفروضة على OpenAI هو القيمة العالية لعملية التفكير في o1 باعتبارها بيانات تدريب للنماذج المستقبلية. إن حماية هذه الملكية الفكرية القيمة من المنافسين هو الدافع الرئيسي.

اعتبارات رئيسية عند استخدام نموذج o1

التكلفة العالية: إن استخدام نموذج o1 مكلف؛ حيث تبلغ تكلفة إنتاج مليون وحدة token $60.

التكاليف المخفية: تتضمن التكلفة أسبابًا غير مرئية tokens، مما يزيد من التكلفة الإجمالية.

نهج فعال من حيث التكلفة: بالنسبة لمعظم المهام، يعد GPT-4 نقطة بداية أكثر اقتصادًا. استخدم o1 فقط عندما تكون قدرات GPT-4 غير كافية.

الاتجاهات المستقبلية

يمثل الكشف عن سلسلة o1 من OpenAI لحظة محورية في تطوير AI. تمثل قدرات التفكير المتفوقة للنموذج، والتي تتفوق حتى على الخبراء البشريين في مجالات معينة، تقدمًا كبيرًا مقارنة بنماذج GPT السابقة.

ومع ذلك، فإن نموذج o1 ليس خاليًا من القيود. فتكلفته المرتفعة، إلى جانب التكاليف الخفية المرتبطة بـ tokens غير المرئية، تتطلب اتباع نهج استراتيجي لاستخدامه. وعلاوة على ذلك، تسلط القيود التي يفرضها OpenAI على الوصول إلى عملية التفكير الكاملة للنموذج الضوء على التحديات المستمرة في تحقيق التوازن بين الابتكار وحماية الملكية الفكرية. وفي حين أن الإمكانات المستقبلية لـ o1 هائلة، مع امتداد أوقات التفكير المتوقعة إلى ساعات أو حتى أسابيع، فإن المرحلة الحالية من تطويرها تتطلب دراسة متأنية ومزيدًا من الاستكشاف من قبل مجتمع المطورين لإطلاق العنان لإمكاناته بالكامل. لقد بدأت الرحلة نحو التفكير المتقدم حقًا في AI، وo1 هي خطوة مهمة على هذا الطريق.

هل أنت مهتم باستكشاف إمكانات سلسلة o1 من OpenAI؟ تعرف على المزيد حول قدراتها وفكر في كيفية إحداث هذه التكنولوجيا الرائدة ثورة في عملك في مجال البحث والتطوير. اتصل بـ Cloudsway لمزيد من المعلومات.

شارك هذه التدوينة

تواصل مع أحد خبراء AI السحابي!

أشياء تحتاج إلى معرفتها حول طراز OpenAI الجديد القوي o1

شارك هذه التدوينة

منتجات

شركة

قانوني

أشياء تحتاج إلى معرفتها حول طراز OpenAI الجديد القوي o1

شارك هذه التدوينة

منتجات

شركة

قانوني

اتصل بنا