در تاریخ ۹ جولای ۲۰۲۵، ایلان ماسک و تیمی از xAI در یک پخش زنده با یک ساعت تأخیر، Grok 4 را معرفی کردند؛ جدیدترین مدل هوش مصنوعی که به ادعای ماسک، وارد عصر «انفجار بزرگ هوش» شده است. این مدل با ویژگیهای چندوجهی، استدلال سریعتر، و رابط کاربری ارتقایافته، بهعنوان پیشرفتهترین دستاورد xAI معرفی شد.
اما این عرضه با جنجالهایی همراه بوده است؛ از جمله انتقادات به پاسخهای نژادپرستانهٔ نسخههای قبلی Grok و استعفای لیندا یاکارینو، مدیرعامل X، که سؤالاتی دربارهٔ ثبات xAI ایجاد کرده است. در این مقاله، به بررسی ویژگیها، نقاط قوت و ضعف Grok 4 و جایگاه آن در رقابت با مدلهایی مانند GPT-5 و Claude 4 Opus میپردازیم.
با این حال، عرضهٔ Grok 4 در سایهٔ جنجالهایی قرار گرفته است. نسخههای قبلی Grok به دلیل تولید محتوای نژادپرستانه و یهودستیزانه مورد انتقاد قرار گرفتند؛ از جمله پستهایی که هیتلر را «مرد سبیلو تاریخ» نامیدند یا به مدیران یهودی هالیوود حمله کردند. این مسائل، همراه با استعفای لیندا یاکارینو، مدیرعامل X (نه xAI)، سؤالاتی دربارهٔ مدیریت محتوا و ثبات داخلی شرکت ایجاد کرده است.
ویژگیهای کلیدی Grok 4

Grok 4 با مجموعهای از قابلیتهای پیشرفته طراحی شده که آن را در رقابت با مدلهای برتر مانند GPT-5 (که هنوز عرضه نشده) و Claude 4 Opus از Anthropic قرار میدهد. در زیر به مهمترین ویژگیهای این مدل اشاره میکنیم:
- استدلال پیشرفته در سطح علمی: Grok 4 روی ابررایانهٔ Colossus آموزش دیده و توانایی استدلال در سطح دکتری در تمامی رشتهها را دارد. این مدل در آزمونهای معتبری مانند ARC-AGI-2 با امتیاز ۱۶.۲٪ (تقریباً دو برابر Claude 4 Opus) و Humanity’s Last Exam با ۴۴.۴٪ (با ابزارها) عملکردی پیشرو داشته است.
- قابلیتهای چندوجهی: Grok 4 در حال حاضر از پردازش متن پشتیبانی میکند و بهزودی قابلیتهای پردازش تصویر و احتمالاً ویدئو را نیز اضافه خواهد کرد. این ویژگی آن را به رقیبی برای GPT-5o و Gemini 2.5 Pro تبدیل میکند.
- نسخهٔ متمرکز بر کدنویسی (Grok 4 Code): این نسخه برای توسعهدهندگان طراحی شده و توانایی نوشتن، دیباگ، و توضیح کد را با دقت بالا دارد؛ مشابه ابزارهایی مانند GitHub Copilot و GPT-4 Code Interpreter. Grok 4 Code با محیطهای توسعهٔ یکپارچه (IDE) مانند Cursor ادغام میشود و میتواند بهصورت بلادرنگ با کدهای کاربران تعامل کند.
- دسترسی بلادرنگ به وب با DeepSearch: ابزار DeepSearch امکان دسترسی به دادههای بلادرنگ از وب، بهویژه از پلتفرم X، را فراهم میکند. این قابلیت به Grok 4 اجازه میدهد اطلاعات بهروز را بدون نیاز به مرورگر ارائه دهد؛ ویژگیای که آن را از Claude 3 Opus که فاقد دسترسی بلادرنگ است، متمایز میکند.
- صدا و تعامل انسانی: Grok 4 Voice با صدایی طبیعیتر و وقفههای کمتر، تجربهای نزدیک به گفتوگوی انسانی ارائه میدهد.
- هوش فرهنگی و میمها: Grok 4 برای درک فرهنگ اینترنت، میمها، اصطلاحات، و طنز آموزش دیده و به گفتهٔ xAI، در این زمینه از رقبایی مانند ChatGPT و Gemini پیشی میگیرد.
- نسخهٔ Grok 4 Heavy: این نسخه از رویکرد چندعاملی استفاده میکند که در آن چندین عامل بهصورت همزمان مسائل را بررسی و نتایج را مقایسه میکنند (مشابه یک گروه مطالعاتی) و عملکردی قویتر در آزمونها ارائه میدهد.
تمام حواشی Grok 4

Grok 4 در حالی معرفی شد که xAI نهتنها با چالشهای فنی روبهروست، بلکه باید برای بقای اعتبار خود نیز بجنگد.
- حواشی محتوایی: رویکرد «آزادی بیان» بدون فیلتر این پلتفرم، منجر به خروجیهای نگرانکنندهای از جمله محتوای نژادپرستانه و مغرضانه در نسخههای قبلی شده است. این موضوع، سؤالات جدی را دربارهٔ میزان نصب حفاظهای ایمنی (guardrails) توسط xAI ایجاد کرده است.
- استعفای مدیرعامل X: افزون بر این چالشها، لیندا یاکارینو، مدیرعامل پلتفرم X (توییتر سابق)، از سمت خود کنارهگیری کرد. هرچند X شرکتی مجزا از xAI است، این رویداد بر فضای متلاطم اکوسیستم تحت مدیریت ماسک میافزاید.
- رویکرد ضد «Woke»: ایلان ماسک بهطور فزایندهای xAI را بهعنوان رقیبی برای مدلهای بهاصطلاح «بیدار» (woke) مانند ChatGPT و Gemini معرفی کرده و عمدتاً در برابر جنجالهای اخیر سکوت کرده است.
مقایسه با رقبا: Grok 4 با هوشترین هوش مصنوعی است؟

ادعای «باهوشترین» بودن، تنها با قرار گرفتن در میدان رقابت سنجیده میشود. Grok 4 باید با سه رقیب اصلی خود یعنی سری GPT از OpenAI، Claude از Anthropic، و Gemini از Google رقابت کند.
| ویژگی | Grok 4 (xAI) | GPT-5 (OpenAI) (بر اساس انتظارات) |
Claude 4 Opus (Anthropic) | Gemini 2.5 Pro (Google) |
|---|---|---|---|---|
| نقطهٔ قوت اصلی | استدلال خام و ریاضیات، سرعت | هوش یکپارچه و تطبیقپذیر | قابلیت اطمینان، ایمنی، و وظایف سازمانی | پنجرهٔ زمینهٔ عظیم، قابلیتهای چندوجهی |
| استدلال و بنچمارکها | پیشتاز در آزمونهای دشوار مانند HLE و GPQA. عملکرد فوقالعاده در ریاضیات و فیزیک. | انتظار میرود بسیار قدرتمند باشد، اما هنوز دادههای رسمی منتشر نشده است. | استدلال قوی و قابلپیشبینی، اما در بنچمارکهای استدلال خام از Grok 4 عقبتر است. | عملکرد بسیار خوب، اما در آزمونهای استدلال سطح بالا، رتبهٔ دوم را پس از Grok 4 کسب کرده است. |
| برنامهنویسی | نسخهٔ تخصصی Grok 4 Code با امتیاز بالا در بنچمارک SWE-Bench. | بسیار توانمند با ابزارهایی مانند Code Interpreter. | بسیار قابلاعتماد برای پروژههای بزرگ و حفظ ساختار کد. | توانایی تحلیل و رفع اشکال در پایگاه کدهای بسیار بزرگ به لطف پنجرهٔ زمینهٔ وسیع. |
| چندوجهی (Multimodality) | نقطهٔ ضعف فعلی. قابلیت درک تصویر و ویدئو در آینده اضافه خواهد شد. | نقطهٔ قوت اصلی. انتظار میرود یک مدل کاملاً چندوجهی (متن، تصویر، صدا، ویدئو) باشد. | از تحلیل تصویر پشتیبانی میکند، اما تمرکز اصلی آن نیست. | پیشتاز فعلی. توانایی تحلیل همزمان هزاران فایل، تصویر، ویدئو، و فایل صوتی در یک پرامپت. |
| دسترسی به اطلاعات روز | عالی؛ دسترسی زنده به اطلاعات وب از طریق پلتفرم X با ابزار DeepSearch. | خوب؛ از طریق ابزارهای مرورگر داخلی. | خوب؛ از طریق ابزارهای داخلی. | عالی؛ با دسترسی به قدرت جستوجوی گوگل. |
| شخصیت و ایمنی | شخصیتپردازیشده، طعنهآمیز، و با حفاظهای ایمنی کمتر (Edgy). | تمرکز بالا بر ایمنی و همسویی (Alignment)، لحنی خنثی و مفید. | تمرکز حداکثری بر ایمنی و قابلاعتماد بودن برای کسبوکارها. | تمرکز بر ایمنی و ارائهٔ پاسخهای مسئولانه. |
| پنجرهٔ زمینه (Context) | ۱۳۰ هزار توکن. | انتظار میرود بیش از ۱ میلیون توکن باشد. | ۲۰۰ هزار توکن. | تا ۲ میلیون توکن؛ قادر به تحلیل چندین کتاب بهصورت یکجا. |
آیا Grok 4 برای شما مفید است؟



























