به گزارش خبرگزاری صحت خبر، این حرکت که با شعار نمادین «حالا نهنگ میتواند ببیند» همراه شده، نشاندهنده ورود رسمی این استارتاپ پیشرو به رقابت مستقیم با مدلهای چندوجهی (Multimodal) شرکتهایی نظیر OpenAI و گوگل است.
طبق گزارشهای منتشر شده، تیم توسعه دیپسیک با انتشار پیامی کنایهآمیز و تصویری از نماد این شرکت (نهنگ) که چشمبندش برداشته شده، اعلام کرد که مدلهای جدید این شرکت اکنون قادر به تحلیل، تفسیر و درک تصاویر هستند. تا پیش از این، تمرکز اصلی دیپسیک بر پردازش متن و کدنویسی با بهرهوری بالا بود، اما با این بهروزرسانی، کاربران میتوانند دادههای تصویری را نیز برای تحلیل به این هوش مصنوعی بسپارند.
اضافه شدن قابلیت Vision به DeepSeek تنها یک ارتقای فنی ساده نیست؛ بلکه یک راهبرد تجاری برای کاهش وابستگی به مدلهای غربی است. این شرکت که پیشتر با مدل V3 و R1 ثابت کرده بود میتوان با هزینهای به مراتب کمتر از مدلهای GPT-4، به عملکردی مشابه دست یافت، حالا قصد دارد در حوزه درک تصویر نیز موازنه قدرت را تغییر دهد.
بررسیهای اولیه نشان میدهد که مدل بینایی دیپسیک میتواند در حوزههایی نظیر:
- تحلیل نمودارهای پیچیده مالی و آماری؛
- توضیح محتوای تصاویر و شناسایی اشیاء؛
- تبدیل طرحهای دستی به کدهای برنامهنویسی؛
عملکردی در سطح استانداردهای جهانی ارائه دهد.
این خبر در حالی منتشر میشود که غولهای فناوری آمریکایی به شدت تحت فشار هستند تا هزینههای آموزشی و عملیاتی هوش مصنوعی خود را کاهش دهند. ورود دیپسیک به حوزه مدلهای چندوجهی با همان رویکرد «متنباز» و «کمهزینه»، میتواند دسترسی توسعهدهندگان سراسر جهان به ابزارهای پیشرفته بینایی را به شکلی بیسابقه تسهیل کند.
دیپسیک با بینا کردن «نهنگ» خود، پیام روشنی به صنعت فناوری ارسال کرد: دوران مدلهای صرفاً متنی به پایان رسیده است. حالا این استارتاپ چینی نه تنها در قدرت استدلال، بلکه در درک جهان فیزیکی (از طریق تصویر) نیز مدعی جدیِ رقابت با رهبران کنونی بازار است.
منبع: scmp
۲۲۷۲۲۷