Étiquette : GPT-4o

  • OpenAI تطلق GPT-4.5 .. أكبر نموذج لغوي لها حتى الآن

    أعلنت شركة OpenAI عن إطلاق نموذجها الجديد GPT-4.5، الذي وصفته بأنه “أكبر النماذج وأكثرها معرفة” حتى الآن، لكنه ليس نموذجًا من الفئة الرائدة (Frontier Model)، وقد لا يتفوق في الأداء على نماذج أخرى للشركة مثل o1 أو o3-mini.

    ويتميز نموذج GPT-4.5 بقدرات مُحسنة في الكتابة، ومعرفة أوسع بالعالم، بالإضافة إلى شخصية أكثر تطورًا مقارنة بالإصدارات السابقة. ومع ذلك، لا يقدم النموذج قفزات تقنية كافية ليُصنف ضمن الفئة الرائدة، وفقًا للشركة.

    وأوضحت OpenAI أن النموذج الجديد “يحسن كفاءة GPT-4 الحسابية بأكثر من 10 أضعاف”، لكنه لا يضيف قدرات جديدة جوهرية في مجال الاستدلال مقارنةً بالإصدارات السابقة، كما أن أداءه أقل من o1 و o3-mini في معظم الاختبارات.

    ووفقًا لاختبارات الشركة المبكرة، فقد وجد المستخدمون أن النموذج الجديد يقدم تجربة حوار أكثر طبيعية، مع قدرة على التعبير عن الدفء، وإظهار مستوى من الذكاء العاطفي لم يكن متاحًا في الإصدارات السابقة.

    وتعزو OpenAI التحسينات الملحوظة في GPT-4.5 إلى التطورات التي أجرتها في مجال التعلم غير الخاضع للإشراف، إذ زوّدت الشركة النموذج بمجموعة بيانات غير مصنفة، مما يسمح له باستخراج الأنماط والرؤى منها بنفسه.

    ومع أن النموذج الجديد لا يعتمد على آليات التفكير المتسلسلة مثل نماذج الاستدلال المتقدمة للشركة، فإن التحسينات المعمارية وزيادة كمية البيانات وقوة الحوسبة أسهمت في تعزيز معرفته، وتقليل معدل “الهلوسة” مقارنةً بالإصدارات السابقة.

    وفي هذا السياق، أوضحت OpenAI أن GPT-4.5 سجل أداءً متفوقًا في اختبار SimpleQA، وهو معيار وضعته الشركة لقياس قدرة النماذج على الإجابة عن أسئلة معرفية دقيقة.

    ولا يُعد GPT-4.5 بديلًا مباشرًا لـ GPT-4o أو o3-mini حتى مع تفوقه في بعض الجوانب، إذ تصفه OpenAI بأنه نموذج أكثر ذكاءً وأوسع نطاقًا لكنه عام الاستخدام، وليس مصممًا ليحل محل نماذج الاستدلال. كما أنه ليس نموذجًا متعدد الوسائط مثل GPT-4o، مما يعني أنه لا يدعم مزايا مثل وضع الصوت أو مشاركة الفيديو والشاشة. وبالإضافة إلى ذلك، يُعد النموذج كبيرًا للغاية، ويتطلب قدرة حاسوبية عالية.

    وبحسب الرئيس التنفيذي سام ألتمان، فإن نموذج GPT-4.5 يشكّل محطة انتقالية نحو النماذج المستقبلية للشركة، إذ وصفه بأنه “آخر نموذج غير قائم على التفكير المتسلسل”.

    ومن المتوقع أن يدمج GPT-5 العديد من تقنيات OpenAI المتطورة، مثل نموذج الاستدلال o3، الذي كشفت الشركة عن بعض مزاياه نهاية العام الماضي.

    ومن المقرر أن يتوفر نموذج GPT-4.5 بدايةً من اليوم لمشتركي ChatGPT Pro، على أن يحصل المشتركون في خطط Plus و Team على إمكانية الوصول إليه بدءًا من الأسبوع المقبل. وأكدت OpenAI أنها تسعى إلى جلب قدرات GPT-4.5 المتميزة لكل المستخدمين مستقبلًا.

    إقرأ الخبر من مصدره

  • نوع جديد من نماذج الذكاء الاصطناعي يكسر حاجز السرعة في إنشاء النصوص

    كشفت شركة “Inception Labs”، ومقرها في كاليفورنيا، مؤخرًا عن نوع جديد من نماذج اللغة الكبيرة يعمل بتقنية الانتشار، يمكنه إنشاء النصوص بسرعة أكبر من النماذج التقليدية، ويحمل اسم “Mercury”.

    وعلى عكس النماذج التقليدية التي تولد النص كلمة بكلمة، مثل تلك التي تدعم “شات جي بي تي”، تقوم النماذج المعتمدة على الانتشار بإنشاء الردود بالكامل في وقت واحد، ثم تنقيحها من صورتها الأولية إلى نص أكثر ترابطًا.

    وتنشئ نماذج اللغة الكبيرة التلقيدية النصوص من اليسار إلى اليمين، كلمة تلو الأخرى، باستخدام تقنية تُعرف باسم “الانحدار الذاتي” (autoregression)، حيث يجب أن تنتظر كل كلمة الكلمات السابقة لها قبل أن تظهر.

    أما نماذج اللغة المعتمدة على تقنية الانتشار فتنتج النص بالكامل مرة واحدة وتقوم بتنقيحه وتحسينه تدريجيًا، بحسب تقرير لموقع “Ars Technica” المتخصص في أخبار التكنولوجيا.

    ويقدم هذا النوع من النماذج قدرات النماذج اللغوية الكبيرة التقليدية، بما في ذلك توليد الأكواد والإجابة على الأسئلة، ولكن مع أداء أسرع بشكل كبير وتكاليف حوسبة أقل.

    يبني الباحثون نماذج انتشار النصوص من خلال تدريب شبكة عصبية على بيانات غير واضحة جزئيًا، وجعل النموذج يتوقع بالاكتمال الأكثر احتمالية ثم مقارنة النتائج بالإجابة الفعلية. إذا أجاب النموذج بشكل صحيح، يتم تعزيز الروابط في الشبكة العصبية التي أدت إلى الإجابة الصحيحة.

    وبعد أمثلة كافية، يمكن للنموذج توليد مخرجات ذات احتمالية عالية بما يكفي لتكون مفيدة في مهام مثل البرمجة.

    ووفقًا لـ”Inception Labs”، يسمح نهجها للنموذج بتحسين المخرجات وتصحيح الأخطاء لأنه لا يقتصر على النظر فقط في النصوص التي تم توليدها سابقًا.

    تمكن هذه المعالجة المتوازية من تحقيق سرعة توليد تتجاوز 1,000 رمز في الثانية، كما تم الإبلاغ عنها في نموذج “Mercury” باستخدام وحدات معالجة الرسومات “Nvidia H100”.

    الأداء

    تحافظ نماذج الانتشار هذه على أداء أسرع من أو مماثل للنماذج التقليدية ذات الحجم المماثل.

    ويُزعم أن نموذج “Mercury” لديه سرعة أفضل بكثير، إذ أن نموذج “Mercury Coder Mini ” سجل 88% في اختبار “HumanEval” و77.1% في “MBPP”، وهو ما يعادل تقريبًا أداء GPT-4o” Mini” من “OpenAI”.

    يأتي هذه الأداء بينما يعمل نموذج “Mercury Coder Mini” بسرعة 1,109 رمزًا في الثانية مقارنة بـ 59 رمزًا في الثانية لـ”GPT-4o Mini”، وهذا يمثل ميزة في السرعة تصل إلى حوالي 19 مرة مقارنة بـ”GPT-4o Mini ” مع الحفاظ على أداء مشابه في معايير البرمجة.

    وإذا حافظت نماذج اللغة المعتمدة على الانتشار على الجودة مع تحسين السرعة، فقد تغير الطريقة التي يتطور بها توليد النصوص بواسطة الذكاء الاصطناعي. وحتى الآن، كان الباحثون في مجال الذكاء الاصطناعي منفتحين على الأساليب الجديدة.

    إقرأ الخبر من مصدره

  • إيلون ماسك يعلن إطلاق « أذكى ذكاء اصطناعي في العالم

    أعلنت شركة الذكاء الاصطناعي xAI التابعة لإيلون ماسك، عن إطلاق أحدث نماذجها الرئيسية Grok 3، إلى جانب ميزات جديدة لتطبيقات Grok على iOS والويب.

    ويعد Grok المنافس المباشر لنماذج مثل GPT-4o من OpenAI وGemini من « غوغل »، حيث يتمتع بقدرة على تحليل الصور والرد على الأسئلة، كما يشغّل العديد من الميزات على منصة « إكس » الاجتماعية التي يملكها ماسك.

    وكان تطوير Grok 3 جاريا منذ عدة أشهر، وكان من المقرر إطلاقه في عام 2024، إلا أنه تم تأخيره عن الموعد المحدد.

    وشهد يوم الاثنين إطلاق نموذج الذكاء الاصطناعي الأحدث Grok 3 من xAI، والذي تم تدريبه باستخدام مركز بيانات ضخم في ممفيس يضم حوالي 200 ألف وحدة معالجة رسومات (GPU). دائرة إلكترونية يُمكنها إجراء العمليات الحسابية الرياضية بسرعة عالية.

    ووصف ماسك، خلال الحدث التقديمي، Grok 3 بأنه « أذكى ذكاء اصطناعي على وجه الأرض »، مشيرا إلى قدرته على التفوق على نماذج الذكاء الاصطناعي الحالية في الاستدلال وحل المشكلات.

    وقدم ماسك وفريقه اختبارات قياسية وتحليلات بيانية لتوضيح قدرة Grok 3 على إجراء استدلالات معقدة.

    ووفقا لـxAI، يمكن لقدرات Grok 3 المتطورة معالجة مجموعات بيانات ضخمة بسرعة، ما يعزز الدقة ويقلل من الأخطاء.

    وفي منشور على منصة « إكس »، صرح ماسك بأن Grok 3 تم تطويره باستخدام قدرة حوسبة تفوق Grok 2 بعشرة أضعاف، مع مجموعة بيانات تدريبية موسعة تشمل وثائق من القضايا القانونية. وخلال عرض مباشر، وصف ماسك النموذج الجديد بأنه « ذكاء اصطناعي يسعى للحقيقة إلى أقصى حد، حتى لو كانت هذه الحقيقة تتعارض مع الصواب السياسي ».


    ويتوقع أن تحدث قدرات Grok 3 ثورة في مجالات البحث، وإنشاء المحتوى، وحل المشكلات، ما يجعله أداة قيمة للأفراد والشركات على حد سواء.

    وقال ماسك: « يمكن أن يوفر عليك الكثير من الوقت. شيء قد يستغرق منك نصف ساعة أو ساعة من البحث على الويب أو وسائل التواصل الاجتماعي، يمكنك أن تطلب من Grok 3 إنجازه، وخلال 10 دقائق، سيكمل ساعة من العمل نيابة عنك، وربما بشكل أفضل مما كنت ستفعله بنفسك. »

    وتم تصميم Grok 3 لفهم وتحليل كميات هائلة من المعلومات بدقة محسنة. ويأخذ وكيل الذكاء الاصطناعي Deep Search هذه القدرة إلى مستوى أعلى من خلال إجراء أبحاث موسعة نيابة عن المستخدمين، ما يقلل من الحاجة إلى البحث اليدوي. وهذه الميزة تجعل Grok 3 مفيدا بشكل خاص للمحترفين في الصناعات التي تعتمد على البيانات بكثافة مثل التمويل والطب والهندسة.

    وتم تطوير Grok 3 باستخدام الحاسوب الفائق Colossus التابع لـxAI، والذي تم بناؤه في ثمانية أشهر فقط.

    ويمكن للذكاء الاصطناعي التعرف على الأخطاء في الوقت الفعلي وتصحيحها، وهو تحسن كبير مقارنة بنماذج الذكاء الاصطناعي السابقة. وهذا يقلل من المعلومات المضللة، ويزيد من دقة الردود، ويجعل Grok 3 أكثر موثوقية للاستخدامات المهنية مثل البحث القانوني والدراسات الأكاديمية والتحليل العلمي.

    وأكد ماسك أن نموذج الذكاء الاصطناعي سيحصل على تحديثات يومية، مع إضافة قدرات التفاعل الصوتي في غضون أسبوع.

    ومن المتوقع أن يعزز دمج التفاعل الصوتي في الوقت الفعلي تجربة المستخدم، ما يجعل التفاعل مع الذكاء الاصطناعي أكثر طبيعية وكفاءة.
    العلم الإلكترونية – Interesting Engineering

    إقرأ الخبر من مصدره

  • علي بابا » تؤكد إطلاق نموذج ذكاء اصطناعي يتفوق على « ديب سيك

    أعلنت شركة « علي بابا » الصينية، يوم الأربعاء، إطلاق إصدار جديد لنموذج للذكاء الاصطناعي الخاص بها Qwen 2.5-Max.

    وقالت « رويترز » إن « علي بابا » تعتبر نموذجها Qwen 2.5-Max متفوقا على برنامج « ديب سيك » الصيني.

    ووفقما ذكرت وحدة الحوسبة السحابية التابعة لشركة « علي بابا » في إعلان نُشر على حسابها الرسمي على منصة WeChat، فإن نموذجها يتفوق على GPT-4o وDeepSeek-V3 و Llama-3.1-405B.

    جدير بالذكر أن « ديب سيك » أطلقت مطلع الأسبوع الحالي نموذج لغة جديدا للذكاء الاصطناعي بإمكانيات تفوق النماذج التي تقدمها الشركات الأميركية الكبرى مثل « أوبن إيه آي » وبتكلفة زهيدة للغاية.

    ويعتمد نموذج « ديب سيك » على 2000 رقاقة فقط بتكلفة بلغت 5.6 مليون دولار ليحقق نفس النتائج التي تحققها نماذج الشركات الأميركية التي تحتاج إلى 16 ألف رقاقة بتكلفة تتراوح بين 100 و200 مليون دولار.

    وتجري شركة « مايكروسوفت « وشركة « أوبن إيه آي » مالكة تطبيق « تشات جي بي تي » تحقيقا لمعرفة ما إذا كانت مجموعة قرصنة مرتبطة بشركة « ديب سيك » قد حصلت على بيانات خاصة بتقنيات « أوبن إيه آي » بطرق غير قانونية، بحسب مصادر تحدثت لوكالة بلومبرغ.

    ورصد باحثون في شؤون الأمن لدى « مايكروسوفت » قبل أشهر أفرادا يُعتقد أنهم مرتبطون بشركة « ديب سيك » وهم يستخرجون كمية كبيرة من البيانات باستخدام واجهة برمجة التطبيقات الخاصة بـشركة « أوبن إيه آي »، حسب الأشخاص الذين طلبوا عدم الكشف عن هوياتهم لأن الأمر سري.

    من ناحيته، أوضح ديفيد ساكس، مستشار الذكاء الاصطناعي للرئيس دونالد ترامب، أن هناك أدلة قوية على أن « ديب سيك » اعتمدت على مخرجات نماذج « أوبن إيه آي » للمساعدة في تطوير تقنيتها الخاصة.

    عن سكاي نيوز عربية

    إقرأ الخبر من مصدره

  • OpenAI تطلق “Operator”.. وكيل ذكاء اصطناعي لإتمام المهام عبر الإنترنت

    أعلنت شركة OpenAI إطلاق “Operator“، وهو وكيل ذكاء اصطناعي شامل يمكنه التحكم في متصفح الويب وأداء مهام مستقلة نيابةً عن المستخدم، مثل حجز الإقامات الفندقية أو التسوق عبر الإنترنت، وغيرها من المهام.

    وتوفر الشركة حاليًا “Operator” ضمن اشتراك ChatGPT Pro الذي تبلغ قيمته 200 دولار شهريًا، مع خطط للتوسع لاحقًا من أجل إتاحته ضمن اشتراكات Plus و Team و Enterprise خلال الأشهر المقبلة.

    وتوفر واجهة “Operator” خيارات متعددة للمهام، مثل التسوق والتوصيل وطلب الطعام والسفر، ويمكن للوكيل الذكي تنفيذ هذه المهام تلقائيًا. وعند تفعيل “Operator”، تظهر نافذة متصفح مُخصصة تعرض العمليات التي يقوم بها الوكيل خطوة بخطوة، مع إمكانية تدخل المستخدم في أي وقت.

    ويعتمد “Operator” على نموذج الذكاء الاصطناعي Computer-Using Agent أو (CUA) الذي يجمع بين قدرات الرؤية والتحليل البصري لنموذج GPT-4o وخصائص الاستدلال لنماذج OpenAI المتقدمة. ويعمل النموذج عبر التفاعل مع واجهات مواقع الويب بنحو مشابه للبشر، دون الحاجة إلى استخدام واجهات برمجية مخصصة، إذ يمكنه الضغط على الروابط والتمرير وتعديل الخيارات وإدخال بعض البيانات وغيرها.

    ويطلب “Operator” تأكيد المستخدم قبل تنفيذ أي خطوة مهمة ذات تأثير، مثل تأكيد الطلبات أو إرسال الرسائل الإلكترونية، مما يتيح للمستخدم مراجعة المهام قبل تنفيذها. ومع ذلك، تؤكد الشركة أن النموذج قد لا يعمل بكفاءة في كافة المواقف، إذ تتطلب بعض العمليات الحساسة، مثل المعاملات المصرفية، إشرافًا مباشرًا من المستخدم.

    وأوضحت OpenAI أيضًا أن “Operator” لا يجمع البيانات الشخصية أو يلتقط صورًا لها، وقد تعاونت مع شركات مثل DoorDash و eBay و Instacart و Uber وغيرها لضمان الامتثال لشروط استخدام خدماتها.

    ويشكّل “Operator” نقلة نوعية في قدرات الذكاء الاصطناعي، إذ يتجاوز مجرد تقديم المعلومات إلى تنفيذ إجراءات فعلية عبر الإنترنت.

    ومن الجدير بالذكر أن OpenAI قد تأخرت قليلًا في إعلان تلك التقنية التي سبقتها إليها شركات أخرى منافسة مثل جوجل وأنثروبيك، لكنها أكدت أنها تسعى إلى ضمان الأمان في استخدام هذه التكنولوجيا.

    ومع إطلاق “Operator”، يبدأ فصل جديد في كيفية تفاعل المستخدمين مع الإنترنت وأجهزة الحاسوب.

    ويعد وكلاء الذكاء الاصطناعي (AI Agents) برامج حاسوبية ذكية مصممة لإدراك أشياء محددة، واتخاذ القرارات لتحقيق أهداف بعينها، ويختلف الوكلاء عن برامج الذكاء الاصطناعي التقليدية في قدرتهم على التفاعل مع بيئة ديناميكية، واتخاذ إجراءات بناءً على هذا التفاعل.

    إقرأ الخبر من مصدره

  • مايكروسوفت تطلق خطة جديدة لخدمة Copilot للشركات

    أعلنت شركة مايكروسوفت إطلاق خطة جديدة تحمل اسم “Copilot Chat” موجهة لعملائها من الشركات، وتعتمد تلك الخطة على نموذج الدفع حسب الاستخدام.

    وتضم الخطة العديد من المزايا المدعومة بالذكاء الاصطناعي من حزمة Microsoft 365، لكنها لا تشمل كافة مزاياها الحالية.

    وتستند خطة “Copilot Chat” إلى نموذج GPT-4o من OpenAI، وتتيح للمستخدمين تنفيذ مجموعة من المهام، مثل الإجابة عن أسئلة متعلقة بالأعمال، وأتمتة المهام، وتوليد الصور بالذكاء الاصطناعي.

    وتأتي هذه المزايا كجزء من تطبيق Microsoft 365 Copilot، الذي يُعد امتدادًا لمنصة مايكروسوفت للذكاء الاصطناعي الموجهة للشركات.

    وعلى عكس الاشتراك التقليدي في Microsoft 365 Copilot الذي يكلف 30 دولارًا لكل مستخدم شهريًا، توفر الخطة الجديدة مرونة أكبر من خلال الدفع حسب الاستخدام.

    وقالت مايكروسوفت في منشور على مدونتها: “إن Copilot Chat تُعد نقطة انطلاق قوية لبناء عادة استخدام الذكاء الاصطناعي داخل المؤسسات”.

    وتتيح الخطة للمستخدمين تلخيص الملفات، وإنشاء مستندات عمل، والتعاون مع أعضاء الفريق باستخدام أدوات مدمجة مثل أداة Pages.

    وتسلّط مايكروسوفت الضوء على مزايا الأتمتة، إذ يمكن للمستخدمين استخدام “وكلاء Agents” لأداء مهام أساسية، مثل تقديم تفاصيل الحسابات قبل الاجتماعات، أو إرسال تعليمات إلى العاملين في الميدان.

    ويمكن لمسؤولي تكنولوجيا المعلومات تصميم وكلاء خاصين للمؤسسة وإدارتهم، مع التحكم في صلاحياتهم وضمان أمانهم، وسوف يُسعّر الوكلاء على أساس الاستخدام، لكن مايكروسوفت لم تفصح بعدُ عن تفاصيل الأسعار.

    ولا تشمل خطة “Copilot Chat” بعض المزايا المتقدمة الموجودة في Microsoft 365 Copilot، مثل الوكلاء المدمجين افتراضيًا، والقدرات المخصصة لتطبيقات مايكروسوفت المكتبية، كما أنها تفتقر إلى أدوات التحليل مثل Copilot Analytics التي تقيس استخدام الذكاء الاصطناعي في الشركة.

    وتأتي هذه الخطوة كجزء من جهود مايكروسوفت لجذب المزيد من العملاء إلى الاشتراك في Microsoft 365 Copilot، مع توفير خيارات مرنة للعملاء الذين لديهم احتياجات أقل تعقيدًا.

    ومع ذلك، تواجه الخدمة تحديات. فقد أشارت تقارير إلى أن خدمة Copilot لم تحقق نجاحًا كبيرًا لدى المؤسسات الكبرى، إذ تعدها بعض المؤسسات غير فعّالة ومكلفة وغير آمنة. وأظهر استطلاع أجرته مؤسسة Gartner أن 3.3% فقط من قادة تكنولوجيا المعلومات وجدوا أن الخدمة أضافت قيمة كبيرة إلى شركاتهم.

    إقرأ الخبر من مصدره

  • « مايكروسوفت » تطور نموذجا لذكاء اصطناعي جديد لتنفيذ المهام بنحو مستقل

    أعلنت شركة »مايكروسوفت » تطوير نموذج ذكاء اصطناعي جديد يحمل اسم (Large Action Model أو LAM) يتميز بقدرته على تشغيل برامج « ويندوز » وتنفيذ المهام بنحو مستقل.

    ويشكل هذا النموذج نقلة نوعية في الذكاء الاصطناعي القادر على تنفيذ الأوامر فعليا.

    وعلى عكس النماذج اللغوية التقليدية، مثل (GPT-4o)، التي تقتصر وظيفتها على معالجة النصوص وإنشائها، يتمتع نموذج (LAM) الجديد من شركة « مايكروسوفت » بالقدرة على تحويل طلبات المستخدمين إلى أفعال حقيقية، سواء كان ذلك تشغيل البرامج أو التحكم في الأجهزة، وقد كانت هذه الفكرة موجودة سابقا، لكن (LAM) يعد أول نموذج يدرب بنحو خاص للعمل مع منتجات « مايكروسوفت أوفيس » المكتبية وغيرها من تطبيقات « ويندوز ».

    ومن بين المهام التي يمكن لهذا النموذج الجديد تنفيذها؛ مباشرة عملية الشراء نفسها من خلال التنقل في واجهة المواقع، على عكس النماذج التقليدية التي يقتصر دورها على تقديم تعليمات نصية حول كيفية الشراء.

    وبحسب « مايكروسوفت »، فإن تطوير هذا النموذج يتطلب أربع مراحل رئيسية، وهي التدريب على تخطيط المهام وتقسيم المهمة إلى خطوات منطقية، والتعلم من نماذج متقدمة (مثل GPT-4o) لتحويل الخطط إلى أفعال، والاستكشاف الذاتي، الذي يتيح للنموذج البحث عن حلول جديدة وتجاوز العقبات التي تعجز عنها النماذج الأخرى، بالإضافة إلى التدريب المستند إلى المكافآت لتحسين دقة التنفيذ.

    وجرب الباحثون هذا النموذج الجديد في بيئة اختبار خاصة ببرنامج تحرير النصوص « وورد »، وقد نجح في تنفيذ المهام بنسبة قدرها 71 في المائة، متفوقا على « GPT-4o  » الذي حقق نسبة نجاح بلغت 63 في المائة دون معلومات بصرية، كما كان نموذج « LAM » أسرع، إذ استغرق 30 ثانية فقط لتنفيذ المهمة.

    ويرى الباحثون أن « LAM » يشكل تقدما كبيرا في مجال الذكاء الاصطناعي، مشيرين إلى أنه قد يمهد الطريق لتطوير ذكاء اصطناعي عام (AGI)، فبدلا من الأنظمة التي تقتصر على فهم النصوص وإنتاجها، قد توفر الشركات قريبا مساعدين رقميين يساعدون فعليا في تنفيذ المهام اليومية بنحو فعال.

    إقرأ الخبر من مصدره

  • أوبن أيه آي » تضيف ميزة الكاميرا الصوتية إلى « شات جي بي تي

    أعلنت شركة « OpenAI » عن إطلاق ميزة جديدة في تطبيق « شات جي بي تي » تسمح للمستخدمين بالتفاعل مع ما تراه كاميرا الهاتف الذكي، من خلال ميزة الصوت المتقدم. تعتمد الميزة على نموذج GPT-4o متعدد الوسائط، ما يتيح للتطبيق معالجة الصور والتفاعل معها بطريقة طبيعية وصوتية.

    الميزة الجديدة، التي تم الكشف عنها ضمن فعالية « 12 Days of OpenAI »، ستكون متاحة لمستخدمي خطط ChatGPT Plus وPro ولجميع مستخدمي Teams عبر تطبيق الهواتف الذكية خلال الأيام المقبلة، على أن يتم طرحها لمستخدمي خطط « Enterprise » و »Edu » في يناير المقبل.

    تُفعّل الخاصية بالنقر على أيقونة الصوت في التطبيق، ثم اختيار أيقونة الفيديو. كما تسمح بمشاركة الشاشة، مما يجعل ChatGPT قادراً على معالجة المدخلات البصرية مباشرةً، كما لو كان في مكالمة فيديو مع صديق.

    تشمل التطبيقات العملية لهذه الميزة المساعدة في تركيب الأثاث، تقديم الدعم الفني، إرشادات الطبخ الفورية، ودعم الطلاب في حل المشاكل التعليمية. وأعلنت « OpenAI » أيضاً عن إطلاق « وضع سانتا » بصوت مميز لجميع مستخدمي الصوت المتقدم حتى أوائل يناير.

    إقرأ الخبر من مصدره

  • الذكاء الاصطناعي في ساحة الحرب.. OpenAI تسعى إلى مواجهة الطائرات المسيرة

    أعلنت OpenAI، التي تطوّر روبوت ChatGPT الشهير، شراكة مع شركة Anduril Industries الناشئة في مجال الدفاعات العسكرية لتطوير تقنيات ذكاء اصطناعي تهدف إلى تعزيز قدرات الدفاع الأمريكية ضد الهجمات الجوية بالطائرات المُسيّرة.

    ووفقًا لبيان صادر عن الشركتين يوم الأربعاء، فسوف تُدمج نماذج OpenAI، ومنها GPT-4o و o1، في أنظمة Anduril وبرمجياتها لتحسين كفاءة الدفاعات العسكرية.

    وتأتي هذه الصفقة بعد أقل من عام من تخفيف OpenAI سياساتها بشأن استخدام تقنياتها في الأغراض العسكرية. وما زالت سياسات الشركة تمنع استخدام نماذجها لتطوير الأسلحة أو استخدامها، لكنها ألغت في يناير الماضي بندًا كان يحظر صراحةً إدماج تقنياتها في التطبيقات “العسكرية والحربية”.

    وفي ذلك الوقت، أعلنت الشركة أنها تعمل بالفعل مع وكالة DARPA لتطوير أدوات للأمن السيبراني. وفي أكتوبر الماضي، عيّنت الشركة مسؤول أمن سابقًا من شركة Palantir المتخصصة في تحليل البيانات الضخمة وتقديم الحلول الاستخباراتية، وسط تقارير تشير إلى تسويقه منتجاتها للجيش الأمريكي ومجتمع الأمن القومي.

    وفي تصريح لصحيفة واشنطن بوست، أوضح متحدث باسم OpenAI أن الاتفاقية تتوافق مع سياسات الشركة؛ لأنها تركز على أنظمة دفاعية ضد الطائرات المُسيّرة، مؤكدًا أن الشراكة لا تشمل استخدامات أخرى.

    وتهدف تلك الشراكة إلى تحسين تقنيات Anduril في الكشف عن الطائرات المُسيّرة وإسقاطها، خاصةً تلك التي تهدد القوات الأمريكية وحلفاءها.

    يذكر أن البنتاغون يعتمد بالفعل على نظام Roadrunner لاعتراض الطائرات المُسيّرة الذي تنتجه شركة Anduril، والذي صُمم لمواجهة التهديد المتزايد من الطائرات الصغيرة في ساحات القتال العالمية. كما توفر الشركة أبراج مراقبة، وأجهزة تشويش على الاتصالات، وطائرات عسكرية مُسيّرة، وغواصات ذاتية القيادة ضمن مشاريعها الدفاعية المتنوعة.

    وقد طُرحت الشراكة بزعم حماية أفراد الجيش الأمريكي ومواجهة تقدم الصين في مجال الذكاء الاصطناعي. وقال الرئيس التنفيذي لشركة Anduril، برايان شيمف، في بيانٍ رسمي: “ستتيح لنا شراكتنا مع OpenAI الاستفادة من خبراتهم العالمية في الذكاء الاصطناعي لسد الفجوات الملحة في قدرات الدفاع الجوي على مستوى العالم. نحن ملتزمون معًا بتطوير حلول مسؤولة تمكن المُشغلين العسكريين والاستخباراتيين من اتخاذ قرارات أسرع وأكثر دقة في المواقف الحرجة”.

    يذكر أن شركة Anduril أُسست على يد بالمر لاكي، مُبتكر نظارة Oculus Rift للواقع الافتراضي، التي كانت الأساس لسلسلة نظارات ميتا Quest التي تهيمن حاليًا على سوق الواقع الافتراضي والمعزز. وقد غادر لاكي شركة ميتا في عام 2017، ليؤسس شركته الخاصة.

    ومن جانبه، صرح الرئيس التنفيذي لشركة OpenAI، سام ألتمان قائلًا: “نحن نبني الذكاء الاصطناعي لنخدم أكبر عدد ممكن من الناس، وندعم الجهود الأمريكية لضمان أن تحترم التكنولوجيا القيم الديمقراطية. إن شراكتنا مع Anduril ستساعد في ضمان أن تقنيات OpenAI تحمي أفراد الجيش الأمريكي، وتسهم في تعزيز فهم مجتمع الأمن القومي هذه التكنولوجيا واستخدامها بمسؤولية للحفاظ على سلامة المواطنين وحريتهم”.

    إقرأ الخبر من مصدره

  • تحذير.. ChatGPT-4o قد يُستخدم في الاحتيال وسرقة الأموال

    أظهرت دراسة حديثة أن واجهة برمجة التطبيقات الصوتية لمساعد ChatGPT-4o من OpenAI قد يستغلها مجرمو الإنترنت لتنفيذ عمليات احتيال مالي، وتتراوح معدلات نجاح هذه العمليات بين منخفضة ومتوسطة.

    ويُعد ChatGPT-4o أحدث نموذج ذكاء اصطناعي من OpenAI، ويتميز بقدرته على استيعاب النصوص والأصوات والمرئيات وإخراجها. وللحد من إساءة الاستخدام، أدمجت OpenAI آليات أمان عدة تهدف إلى اكتشاف المحتوى الضار، ومنع تكرار الأصوات غير المُصرّح بها.

    ومع ازدياد انتشار تقنيات التزييف الصوتي العميق وأدوات تحويل النص إلى صوت، تتفاقم مشكلة الاحتيال الصوتي التي تُقدر خسائرها بالملايين.

    ونشر باحثون من جامعة إلينوي ورقة بحثية تبين أن الأدوات التقنية الحديثة المتاحة للجمهور تفتقر إلى آليات حماية كافية من إساءة استخدامها في عمليات الاحتيال.

    واستعرضت الدراسة أنواعًا متعددة من عمليات الاحتيال، ومنها التحويلات المصرفية وسرقة بطاقات الهدايا وتحويل العملات الرقمية وسرقة بيانات حسابات التواصل الاجتماعي والبريد الإلكتروني.

    وتستخدم هذه العمليات الاحتيالية أدوات مُبرمجة تعتمد على الصوت في ChatGPT-4o للتنقل بين صفحات الويب، وإدخال البيانات، وإدارة الأكواد الخاصة بالمصادقة الثنائية، واتباع إرشادات الاحتيال. ويرفض نموذج GPT-4o غالبًا التعامل مع بيانات حساسة، لكن الباحثين استطاعوا تجاوز بعض القيود باستخدام تقنيات بسيطة لتحفيز النموذج على الاستجابة.

    ولإثبات فاعلية عمليات الاحتيال، حاكى الباحثون أدوار الضحايا في التجارب، واستخدموا مواقع مثل “بنك أمريكا” للتحقق من نجاح عمليات التحويل المصرفي، لكنهم لم يقيسوا مدى قدرة النموذج على الإقناع.

    وأظهرت التجارب أن معدلات النجاح تراوحت بين 20% و 60%، مع احتياج كل محاولة لما يصل إلى 26 خطوة متتالية عبر المتصفح، وقد استغرقت نحو ثلاث دقائق في الحالات المعقدة. وقد نجحت عمليات سرقة بيانات حسابات Gmail بنسبة قدرها 60%، في حين بلغت نسبة نجاح عمليات تحويل العملات الرقمية وسرقة بيانات إنستاجرام 40%.

    ومن ناحية التكاليف، فإن تكلفة تنفيذ عمليات الاحتيال تُعد منخفضة؛ إذ بلغت تكلفة كل عملية ناجحة نحو 75 سنتًا أمريكيًا، في حين بلغت تكلفة عمليات التحويل المصرفي الأكثر تعقيدًا نحو 2.51 دولار فقط.

    وفي تعليق لشركة OpenAI نشره موقع BleepingComputer التقني، أشارت إلى أن نموذجها الأحدث “o1-preview” يتمتع بقدرات عالية في مقاومة محاولات الاحتيال، وتحسين الأمان مقارنةً بالنماذج السابقة، كما يحقق تقييمًا عاليًا في اختبارات الأمان بنسبة قدرها 93%، مقارنةً بـ 71% في نموذج GPT-4o.

    وأوضحت OpenAI أن الأبحاث الأكاديمية، مثل تلك التي قدمتها جامعة إلينوي، تُسهم في تحسين ChatGPT لمواجهة الاستخدامات الضارة. وأكدّت الشركة التزامها بتعزيز آليات الأمان في نماذجها القادمة، كما أنها تقيّد توليد الأصوات في GPT-4o بمجموعة من الأصوات المُصرّح بها لتجنب عمليات التزييف الصوتي.

    إقرأ الخبر من مصدره