ChatGPT-4 مقابل ChatGPT-3.5 افتراضي مقابل ChatGPT-3.5 قديم: تم اختبار الاختلافات

من المتوقع أن يتسبب ChatGPT 4.0 في إحداث موجات كبيرة في عالم chatbot. لكن هل هي حقا أفضل من سابقتها؟ دعنا نتحقق.

كان ChatGPT مجرد غيض من فيض الأتمتة القادم ، مع اتباع كل من Google و Microsoft والعديد من الشركات الأخرى التي تعمل في مجال الذكاء الاصطناعي.

بالنسبة للمبتدئين ، وجدنا بعض برامج الدردشة مثل ChatGPT ، وكثير منها لا ينتمي إلى شركات التكنولوجيا الكبيرة.

لكن نسميها قوة التسويق ؛ لا يزال ChatGPT هو الملك المسيطر على كل روبوتات الذكاء الاصطناعي هذه. يمكنها القيام بالعديد من الأشياء ، بما في ذلك الرياضيات والشعر ومنشورات المدونات ، حتى أن الناس يستخدمون ذلك لرفع دعاوى قضائية.

تعمل DoNotPay على استخدام GPT-4 لإنشاء “دعاوى قضائية بنقرة واحدة” لمقاضاة المتصلين الآليين مقابل 1500 دولار. تخيل تلقي مكالمة ، والنقر فوق زر ، وتم نسخ المكالمة وإنشاء دعوى قضائية من 1000 كلمة. لم يكن GPT-3.5 جيدًا بما يكفي ، لكن GPT-4 يتعامل مع المهمة بشكل جيد للغاية: pic.twitter.com/gplf79kaqG

– جوشوا براودر (@ jbrowder1) 14 مارس 2023

لديها الكثير من المحترفين القلقين من أن مهاراتهم ستصبح عديمة الفائدة في المستقبل القريب.

ومع ذلك ، فقد قرأت منشورًا على Linkedin جاء فيه:

لن يحل الذكاء الاصطناعي محلك ، لكن الشخص الذي يستخدم الذكاء الاصطناعي يمكنه ذلك.

لذلك ، دعونا نتعرف على آخر تحديث لـ ChatGPT ونرى كيف يختلف عن الإصدارات السابقة.

ChatGPT: قديم ، افتراضي ، وتحديث

لذلك هناك ثلاثة إصدارات متاحة للمستخدمين المدفوعين: Legacy (3.5) ، Default (3.5) ، وتحديث ChatGPT الأخير (4).

على الرغم من أننا سنتعمق قليلاً في قدراتهم ، فإن هذا ما يجب أن تقوله شركة OpenAI عن الاختلافات:

المصدر: OpenAI

لذلك ، في حين أن المستخدمين المجانيين لديهم Legacy 3.5 فقط للعب به ، فإن الاشتراك المتميز يقدم الثلاثة لمحاولة تسوية ما يعتقد المستخدمون أنه الأفضل.

لتلخيص الصورة السابقة ، تتعلق الخطط المدفوعة بالحصول على نتائج أكثر دقة بسرعة مناسبة. ومع ذلك ، فإن الفروق تظهر فقط إذا كانت المطالبات معقدة وتحتاج إلى الإبداع.

المعلمة ChatGPT 4ChatGPT 3.5Bar نتيجة الاختبار أعلى 10٪ أسفل 10٪ تحدي الذكاء AI2 (ARC) 96.3٪ 85.2٪ درجة ترميز Python 67٪ 48.1٪ تفسير مرئي نعم لا يوجد نص أكثر من 25 ألف كلمة أقل مصدر: OpenAI

إلى جانب ذلك ، يمكن أن يقبل ChatGPT 4 المدخلات المرئية.

حسنًا ، يكفي تعريف الكتاب المدرسي. دعنا نتسخ أيدينا ونقيّم هؤلاء المرشحين في ساحة المعركة الواقعية.

أقسام أخرى مليئة بالصور التي قد تبدو غير واضحة. في مثل هذه الحالة ، انقر بزر الماوس الأيمن فوق أي صورة وحدد فتح في علامة تبويب جديدة لعرضها بشكل صحيح.

الرياضيات

كوني خريج هندسة ، لا يسعني إلا طرح بعض المشاكل الأساسية عليهم. لنبدأ بسهولة بالمعادلات الجبرية.

المرحلة الأولى

لقد رأى الكثير منا هذه المعادلات ax2 + bx + c = 0 ، حيث يتعين علينا حل X. هنا ، أعطيت هذه المطالبة البسيطة ، حل من أجل x: x2 + x – 6 = 0

  11 واجهة برمجة تطبيقات QR Code لإنشاء رموز في ثوانٍ

بينما أعطى الجميع نفس الجذور (X = -3،2) ، كان Legacy والتحديث أكثر تشابهًا في استخدام الصيغة مباشرة (كما سيفعل أي طالب) لمعرفة النتيجة.

ومع ذلك ، أوضح الإصدار الافتراضي 3.5 طريقتين ، بما في ذلك التحليل إلى عوامل ، والتي عادةً ما ينشرها أي طالب ماهر عند إعطاء مثل هذه المعادلات العادية.

المرحلة الثانية

بعد ذلك ، أطالبه بحل معادلة تكعيبية معقدة بعض الشيء: x ^ 3 -12x ^ 2 + 48x – 64 = 0.

لقد أثبت هذا حقًا سبب كون ChatGPT 4 هو “التحديث”.

ها هي الردود:

كل هذا الضجيج و ChatGPT Legacy and Default لا يمكن أن يحل المعادلة التكعيبية العامة. ومع ذلك ، كان أداء Legacy أفضل قليلاً ووجد جذرين بشكل صحيح ، بينما فشل Default مع الجميع.

كان التحديث هو الفائز الواضح في المرحلة الثانية وحل المعادلة بشكل مثالي ، وإيجاد الجذور الثلاثة بشرح جميل.

التفكير المنطقي

يمكننا أن نفترض بأمان أن معظم مسائل الرياضيات الأولية لها حلول معجمية. إذا كنت تعرف النظرية أو الصيغة ، أدخل القيم واحصل على النتائج.

ويمكن لـ ChatGPT ، كونها منظمة العفو الدولية ، إجراء عمل سريع لمثل هذه الاستعلامات. ومع ذلك ، فإن التفكير المنطقي هو منطقة مختلفة ، مع وجود فرص عالية للذكاء الاصطناعي في التراجع.

المرحلة الأولى

أعطيتهم الكلاسيكية:

أ أقدم من ب.
C أقدم من A.
B أقدم من C.
هل العبارة الثالثة صحيحة أم خاطئة إذا كانت العبارتان الأوليان صحيحة؟

وكانت جميع إصدارات ChatGPT صحيحة في الإشارة إلى أن العبارة الثالثة كانت خاطئة.

بعد ذلك ، استخدمت الأسماء بدلاً من الأبجدية ، وقد تفاجئك النتائج:

لذلك ، واصل الإصدار الافتراضي 3.5 أداءه دون المستوى وتم الخلط بينه وبين هذا الاختلاف المتواضع. ومع ذلك ، كان أداء Legacy و Update على النحو الأمثل.

المرحلة الثانية

ربما لاحظت الآن أن الغرض من هذه المرحلة الأولى والمرحلة الثانية هو العثور على نقطة الاختلاف ، حيث يميز تعقيد موجه معين التحديث عن المرحلتين الباقيتين.

هنا ، كان الموجه لغزًا منطقيًا بسيطًا:

في صباح أحد الأيام بعد شروق الشمس ، كان روهيت واقفًا في مواجهة عمود. سقط ظل القطب بالضبط على يمينه. إلى أي اتجاه كان يواجه؟
أ. شمال
ب. الغرب
ج. جنوب
د. شرق

دفع هذا الميراث لإعطاء إجابة غير دقيقة ، في حين أن الافتراضي استجاب بتوضيحات غامضة أدت إلى نتيجة خاطئة.

فقط التحديث تألق بالإجابة الصحيحة ، مع عبارات سهلة المتابعة.

حروف

قد يكون رفع الدعاوى القضائية أمرًا صعبًا ، لكن في بعض الأحيان لا يصل الأمر إلى هذا الحد إذا كان بإمكانك صياغة إشعار أول ملفت للنظر.

هنا ، اتبعت هذا التوجيه: اكتب رسالة إلى تيم كوك لتسليم تفاحة لي لعدم الرد على إحدى تغريداتي.

مضحك ، نعم! لكن دعونا نرى ما يمكن أن يصنعه الذكاء الاصطناعي من هذا.

أخذ Legacy 3.5 على الفور موجهًا مثل العبد الآلي وأصدر رسالة يمكن أن تجعلني موضوعًا ممتازًا للسخرية إذا وصلت إلى وجهتها المقصودة.

  ما هي أكواد RPG Simulator؟

لم يكن التقصير جيدًا أيضًا. ومع ذلك ، فقد أسكتني تمامًا كما يفعل رجل عجوز غاضب لطفل يبلغ من العمر خمس سنوات.

في حين أن الحجج المقدمة كانت محددة ، فقد أنهى هذا المرح هناك مع القليل من التعلم.

على الرغم من أن هذا كان موجهًا بسيطًا بدرجة كافية ، إلا أنه احتاج إلى بعض التفكير والإبداع. وهذا هو المكان الذي قدم فيه الأخ الأكبر ، التحديث ، قضيته:

أولاً ، تمت صياغة هذا بالقرب من الكمال. ثانيًا ، لقد وفر لي البحث في Google عن عنوان المقر الرئيسي لشركة Apple (على الرغم من أنه يجب التحقق من هذه الإدخالات).

ثالثًا ، تمت كتابته بشكل جيد بنبرة رسمية ولمسة فكاهية. إلى جانب ذلك ، كانت النية واضحة في سطر الموضوع نفسه.

ومع ذلك ، نقلت الرسالة شعور أحد محبي شركة آبل الساخطين.

لذلك ، هذا يجعل ChatGPT 4 (ويعرف أيضًا باسم التحديث) متقدمًا بأميال على أبناء عمومته القدامى. إنه ذكي إلى حد ما ولديه بعض علامات الفطرة السليمة ، مما يجعله أكثر من مجرد روبوت محادثة ممل وممل.

شِعر

مع إطلاق ChatGPT ، اعتقدت أن الشعر قد يكون نقطة ضعفها.

بعد كل شيء ، يتطلب الأمر عواطف وإبداعًا ومجهودًا كبيرًا للإنسان لخلق شيء له صدى حقيقي لدى قرائه.

ببساطة ، الشعر هو فن في أفضل حالاته ، وتمنيت سرًا أن يفشل الذكاء الاصطناعي. ولكن كان ذلك قبل أن يضرب زميلي في العمل جميعًا بقوة في قناة admingate.org’s Slack من خلال إنشاء ChatGPT الذي كان قبل هذا التحديث 4.0.

المرحلة الأولى

هذا هو التوجيه الذي قدمته لمرشحينا: “عبر بشكل شاعري عن لماذا أو لماذا لا يمكن تقديم البرغر ، جنبًا إلى جنب مع قائمتهم الحالية ، أن يفيد سلسلة بيتزا الدومينو. احتفظ بها أقل من 100 كلمة “.

هل تستطيع ملاحظة الفرق؟

كانت النسخة الافتراضية قصيرة للغاية ، 32 كلمة فقط ، ولم تستطع الاستفادة من النطاق الترددي المتاح لعرض إبداعاتها.

استنتج The Legacy ، على الرغم من أنه استخدم الحد الأقصى من الكلمات بين الثلاثة ، أن محاولة تقديم البيتزا جنبًا إلى جنب ليس محفوفًا بالمخاطر وسيؤدي إلى نجاح أكيد في كلتا الحالتين ، وهذا ليس صحيحًا تمامًا.

كان شعر التحديث عبارة عن 53 كلمة فقط ، مما أدى إلى إهدار ما يقرب من نصف عدد الكلمات المخصص. ومع ذلك ، فقد كان واضحًا بشأن المكافآت والمزالق المحتملة ولم يتم التوصل إلى أي نتيجة ، والتي أعتقد أنها أكثر إنسانية من البقية.

المرحلة الثانية

بعد ذلك ، طلبت منهم جميعًا “شرح الشعر لطفل يبلغ من العمر خمس سنوات”.

ومن المثير للاهتمام ، أن Legacy لم يستطع أن يأخذ السياق من المحادثة ويشرح “الشعر” حرفياً. التقصير أخذ السياق ولخصه في فقرة التي لا تزال لائقة.

استمرارًا لهذا الاتجاه ، قام ChatGPT 4 بتبسيط إبداعه مع الحفاظ على النكهة الشعرية حية.

ChatGPT Premium مقابل ChatGPT مجاني

مجاني ، كونه مجانيًا ، يفتقر إلى السرعة والدقة ولا يتطابق مع ChatGPT 4 ، ولكنه ليس عديم الفائدة تمامًا أيضًا.

  كيفية إصلاح الخطأ "لا يمكن بدء تشغيل هذا الجهاز". (الرمز 10)

لمقارنتها على أساس متساوٍ ، ألقيت عليها نفس المطالبات التي اختبرناها Legacy و Default و Update معها.

🔵 الرياضيات: لقد حلت المعادلات التربيعية لكنها أعطت إجابات خاطئة للمكعب. (مثل الإرث والتخلف)

التفكير المنطقي: اجتاز المرحلة الأولى بالأبجدية والأسماء لكنه فشل في المرحلة الثانية (مثل Legacy).

الرسائل: لم أكتب الخطاب واعتبر الموجه غير أخلاقي وغير مناسب. (مثل الافتراضي)

الشعر: ولد الشعر في أكثر من 30 كلمة وشرحها بشكل لائق. (على غرار الافتراضي).

لذلك ، يمكننا أن نستنتج أن الإصدار المجاني ليس سيئًا أيضًا. في الواقع ، إنه على قدم المساواة مع الإصدار الافتراضي 3.5 بل إنه أفضل في بعض الجوانب.

اقرأ أيضًا: مطالبات قوية لتحسين تجربة ChatGPT الخاصة بك

مقدمة الطريق

الشائعات حول استبدال الذكاء الاصطناعي للوظائف في المستقبل ليست خاطئة تمامًا.

أولاً ، الأتمتة فعلت ذلك في الصناعة التحويلية ، والآن تنتشر في كل مكان آخر.

شخصيًا ، إنها أسرع مني في حل المعادلات التكعيبية ، أو تكوين الشعر ، أو كتابة الحروف. ومع ذلك ، فإن حقيقة أنه نادرًا ما يقول لا للموجه وبالكاد يتعلم من أخطائه يربط طريقه خلفنا نحن البشر.

للتكرار ، لن يحل الذكاء الاصطناعي محلنا ، لكن يمكن لأي شخص يستخدم الذكاء الاصطناعي.

هنا في admingate.org ، يستخدم فريق التسويق لدينا ChatGPT بطرق مثيرة للاهتمام. على سبيل المثال ، وصلنا مؤخرًا إلى 100 مليون مشاهدة ، وفكر رئيسنا التنفيذي في إعادتها إلى الجمهور من خلال الهبة.

وأعتقد أن رجال التسويق احتاجوا إلى عنوان لجذب انتباه القارئ. لذلك ، أعطوا موجهًا واحدًا وطلبوا من ChatGPT اقتراح بعض الاختلافات ، مثل هذا:

إلى جانب ذلك ، نستخدمه لتلخيص المحتوى والتدقيق النحوي واقتراح عناوين للمقالات الجديدة وما إلى ذلك.

بشكل قاطع ، هناك العديد من الطرق للاستفادة والتسابق على الصور النمطية التي ترى الذكاء الاصطناعي على أنه قطعة خردة عديمة الفائدة.

الشيء الوحيد الذي يجب تذكره هو أنه يجب أن يكون هناك شخص ما (بشري) ليحكم على عمل الذكاء الاصطناعي لأنه (بشكل صارخ) غير دقيق ومضلل.

التحديث شيء حقًا!

في لقائي القصير ، شعرت أن ChatGPT 4 أكثر إبداعًا وتفهمًا وواقعية. ومع ذلك ، فهذه آلة ويمكن أن تعطي إجابات خاطئة بثقة.

ولكن المذهل هو مستوى الترقية الذي قامت به OpenAI لهذا المشروع في غضون بضعة أشهر فقط.

ولا أطيق الانتظار لرؤية السحر الذي قد يحيرنا به التحديث القادم!

ملاحظة: ليست مجرد نافذة دردشة ؛ تسخير قوتها مع أفضل ملحقات ChatGPT Chrome. وهل فكرت يومًا في دمج ChatGPT مع Siri؟