ایردراپ تلگرامی + معرفی بیش از 10 ایردراپ معتبر تلگرامی با قیمت بالا+امنیت🟢
جولای 19, 2024ساخت اپل آیدی + روش های ساخت اپل آیدی مزایا و معایب آن+نحوه راه اندازی 🟢
جولای 21, 2024گوگل اکنون کاملاً در «عصر جمینی» خود قرار دارد!. ممکن است این اصطلاح را شنیده باشید. اما معنی آن را ندانید. بنابراین باید دست و پنجه نرم کنید و برای تغییر نام تجاری گوگل آماده شوید. جمینی نامی است که گوگل به نسل فعلی مدلهای هوش مصنوعی چندوجهی خود که سال گذشته عرضه کرد، داد. اما در حال حاضر گوگل در حال استفاده از این کلمه برای سایر خدمات خود هم هست. با توجه به گسترده شدن هوش مصنوعی و استفاده پلتفرم های بزرگ از آن لازم است که بدانیم گوگل جمینی چیست و چه کاربرد هایی دارد. در این مقاله می خواهیم همه چیز را به طور کامل در مورد آن بررسی کنیم.
گوگل جمینی چیست؟
تا همین اواخر، OpenAI نیروی مسلط در دنیای هوش مصنوعی (AI) و رباتهای چت بود. با مدل زبان بزرگ GPT-4 (LLM) که به ChatGPT (بدون اشاره به Copilot مایکروسافت) قدرت میبخشد و دنیا را به طوفان میبرد. این شرکت زودهنگام پیشتاز شد و همه از آن زمان تا کنون در حال ارتقا دادن سیستم های هوش مصنوعی هستند.
با این حال OpenAI یک چالش جدید در قالب Google Gemini دارد. این ورود جدید در فوریه 2024 (پس از اعلام در پایان سال 2023) به صحنه آمد و بلافاصله امواج بزرگی را در دنیای هوش مصنوعی ایجاد کرد. اما آیا گوگل جمینی برای شکست دادن GPT-4 کافی است؟.
در حال حاضر این سرویس چه کاری می تواند انجام دهد و در آینده چه می تواند انجام دهد؟ و اگر می خواهید از Gemini استفاده کنید، دقیقا چگونه این کار را انجام می دهید؟ ما برای یافتن پاسخ همه این سؤالات و موارد دیگر، به دنیای Gemini فرو رفته ایم. اگر در مورد آخرین تلاش های هوش مصنوعی گوگل کنجکاو هستید، اینجا جایی است که باید باشید.
بیشتر بخوانید📘📘📘📘👈👈👈👈 » هک هوش مصنوعی
موضوع اصلی…
گوگل جمینی آخرین مدل زبان بزرگ گوگل (LLM) است. LLM چیست؟ این سیستمی است که زیربنای انواع ابزارهای هوش مصنوعی است که احتمالاً در اینترنت دیده اید و با آنها تعامل داشته اید. به عنوان مثال، GPT-4 به ChatGPT Plus، چت ربات پیشرفته OpenAI که با هزینه باید از آن استفاده کنید
Gemini چیزی بیش از یک مدل هوش مصنوعی است. زیرا نام و هویت جدید چت ربات Bard نیز می باشد. بله، بارد دیگر نیست و به طور کامل توسط جمینی جایگزین شده است. در اصل، گوگل با نامیدن مدل اصلی و ربات چت جمینی، همه چیز را ساده کرده است. علاوه بر این، اکنون یک برنامه رایگان Gemini برای اندروید وجود دارد و Gemini میتواند در صورت تمایل، جایگزین Google Assistant در تلفن اندرویدی شما شود. در iOS، Gemini در برنامه Google حضور دارد.
نسخه های مختلف جمینی
جمینی، نسل بعدی مدلهای هوش مصنوعی نسل بعدی گوگل است که مدتها وعده داده بود. این سرویس توسط آزمایشگاههای تحقیقاتی هوش مصنوعی گوگل DeepMind و Google Research توسعه یافته است. در چهار شکل موجود است:
جمینی اولترا، کارآمدترین مدل جمینی.
Gemini پرو، جایگزینی سبک وزن (Light) برای Ultra.
جمینی فلش، یک نسخه سریعتر از Pro.
Gemini Nano، دو مدل کوچک – Nano-1 و Nano-2 توانمندتر – برای اجرای آفلاین در دستگاه های تلفن همراه.
همه مدلهای Gemini طوری آموزش داده شدهاند که بهطور طبیعی چندوجهی باشند . به عبارت دیگر، قادر به کار و تجزیه و تحلیل بیشتر از متن هستند. گوگل می گوید که آنها از قبل آموزش دیده اند و روی انواع صداها، تصاویر و ویدئوهای عمومی، اختصاصی و دارای مجوز، مجموعه بزرگی از پایگاه های کد و متن به زبان های مختلف، به خوبی تنظیم شده اند.
این امر Gemini را از مدل هایی مانند LaMDA خود گوگل که منحصراً بر روی داده های متنی آموزش داده شده است، متمایز می کند. LaMDA نمی تواند چیزی فراتر از متن را بفهمد یا تولید کند (مثلاً مقاله ها، پیش نویس های ایمیل)، اما این لزوماً در مورد مدل های Gemini صدق نمی کند.
نکته:
ما در اینجا متذکر می شویم که اصول اخلاقی و قانونی مدل های آموزشی در مورد داده های عمومی، در برخی موارد بدون اطلاع یا رضایت صاحبان داده ها، در واقع مبهم است. Google برای محافظت از برخی از مشتریان Google Cloud از شکایت در صورت مواجهه با آنها، یک خطمشی جبران خسارت هوش مصنوعی دارد، اما این خطمشی شامل مواردی است. با احتیاط ادامه دهید، به خصوص اگر قصد استفاده تجاری از Gemini را دارید.
تفاوت بین برنامه های گوگل جمینی و مدل های Gemini چیست؟
گوگل، بار دیگر ثابت کرد که فاقد مهارت در برندسازی است. از همان ابتدا مشخص نکرد که Gemini از برنامههای Gemini در وب و موبایل (بارد سابق) جدا و متمایز است.
برنامههای Gemini کلاینتهایی هستند که به مدلهای مختلف Gemini متصل میشوند – Gemini Ultra (با Gemini Advanced، در زیر ببینید) و Gemini Pro تا کنون – و لایههای رابطهای چتمانند در بالا. آنها را بهعنوان بخشهای جلویی برای هوش مصنوعی مولد Google در نظر بگیرید، مشابه برنامههای ChatGPT OpenAI و خانواده Claude Anthropic.
در اندروید، برنامه Gemini جایگزین برنامه موجود Google Assistant می شود. و در iOS، برنامههای جستجوی Google و Google به عنوان مشتریان Gemini آن پلتفرم عمل میکنند.
برنامههای Gemini میتوانند تصاویر و همچنین دستورات صوتی و متن را بپذیرند – از جمله فایلهایی مانند فایلهای PDF و به زودی ویدیوها، آپلود یا وارد شده از Google Drive – و تصاویر تولید میکنند. همانطور که انتظار دارید، مکالمات با برنامه های Gemini در تلفن همراه به Gemini در وب منتقل می شود و بالعکس اگر در هر دو مکان به یک حساب Google وارد شده باشید.
Gemini در Gmail، Docs، Chrome، ابزارهای توسعه دهنده و موارد دیگر
برنامههای Gemini تنها ابزاری برای جذب کمک مدلهای Gemini در انجام وظایف نیستند. ویژگیهای آغشته به Gemini به آرامی اما مطمئناً راه خود را به برنامهها و سرویسهای اصلی Google مانند Gmail و Google Docs باز میکنند.
برای استفاده از بیشتر این موارد، به Google One AI Premium Plan نیاز دارید. از لحاظ فنی بخشی از Google One، AI Premium Plan 20 دلار هزینه دارد و دسترسی به Gemini را در برنامههای Google Workspace مانند Docs، Slides، Sheets و Meet فراهم میکند. همچنین چیزی را که Google Gemini Advanced می نامد فعال می کند، که Gemini Ultra را به برنامه های Gemini به همراه پشتیبانی برای تجزیه و تحلیل و پاسخ به سوالات مربوط به فایل های آپلود شده می آورد.
کاربران پیشرفته Gemini از اینجا و آنجا امکانات اضافی دریافت میکنند. مانند برنامهریزی سفر در جستجوی Google، که برنامههای سفر سفارشی را از طریق درخواستها ایجاد میکند. با در نظر گرفتن مواردی مانند زمان پرواز (از ایمیلهای موجود در صندوق ورودی Gmail کاربر)، اولویتهای غذا و اطلاعات مربوط به جاذبههای محلی (از جستجوی Google و دادههای Maps). همچنین فواصل بین آن جاذبهها، Gemini یک برنامه سفر ایجاد میکند که بهطور خودکار بهروزرسانی میشود. برای انعکاس هرگونه تغییر
جمینی در سایر بخش ها
در Gmail، Gemini در یک پانل جانبی زندگی میکند. که میتواند ایمیل بنویسد و رشتههای پیام را خلاصه کند. همان پانل را در Docs خواهید دید، جایی که به شما کمک میکند محتوای خود را بنویسید و اصلاح کنید و ایدههای جدید را طوفان فکری کنید. Gemini in Slides اسلایدها و تصاویر سفارشی تولید می کند. و Gemini در Google Sheets داده ها را ردیابی و سازماندهی می کند و جداول و فرمول ها را ایجاد می کند.
دسترسی Gemini به Drive نیز گسترش مییابد، جایی که میتواند فایلها را خلاصه کند و حقایق سریعی درباره یک پروژه ارائه دهد. در همین حال، در Meet، Gemini شرحها را به زبانهای دیگری ترجمه میکند.
Gemini در GmailImage Credits: Google
Gemini اخیراً به مرورگر کروم گوگل در قالب یک ابزار نوشتن هوش مصنوعی وارد شده است. می توانید از آن برای نوشتن چیزی کاملا جدید یا بازنویسی متن موجود استفاده کنید. Google میگوید برای ارائه توصیهها، صفحه وبی را که در آن هستید در نظر میگیرد.
در جای دیگر، نکاتی از Gemini را در محصولات پایگاه داده Google، ابزارهای امنیت ابری، پلتفرم های توسعه برنامه (از جمله Firebase و Project IDX) خواهید دید. به غیر از برنامه هایی مانند Google TV (جایی که Gemini شرح فیلم ها و نمایش های تلویزیونی را تولید می کند)، Google Photos.
Code Assist (قبلاً Duet AI برای توسعه دهندگان)، مجموعه ابزارهای کمکی مبتنی بر هوش مصنوعی Google برای تکمیل و تولید کد، در حال بارگذاری محاسبات سنگین به Gemini است. همچنین محصولات امنیتی Google که زیربنای Gemini هستند. مانند Gemini in Threat Intelligence، که میتواند بخشهای بزرگی از کدهای مخرب بالقوه را تجزیه و تحلیل کند . سپس به کاربران اجازه دهد به زبان طبیعی برای تهدیدهای مداوم یا شاخصهای سازش جستجو کنند، هستند.
چت ربات های سفارشی Gemini Gems
کاربران گوگل جمینی Advanced که در Google I/O 2024 معرفی شدند، میتوانند در آینده Gems، چترباتهای سفارشیشده با مدلهای Gemini را ایجاد کنند. جواهرات را می توان از توضیحات زبان طبیعی تولید کرد . به عنوان مثال، «تو مربی دویدن من هستی. یک برنامه دویدن روزانه به من بدهید» – و با دیگران به اشتراک گذاشته یا خصوصی نگه داشته می شود.
در نهایت، Gems میتواند از مجموعه گستردهای از ادغامها با سرویسهای Google، از جمله Google Calendar، Tasks، Keep و YouTube Music برای انجام کارهای مختلف استفاده کند.
Gemini چت صوتی عمیق زنده
تجربه جدیدی به نام Gemini Live که مختص مشترکین Gemini Advanced است، به زودی در اپلیکیشنهای Gemini در موبایل ارائه میشود و به کاربران امکان میدهد با جمینی چتهای صوتی «عمیق» داشته باشند.
با فعال کردن Gemini Live، کاربران میتوانند هنگام صحبت کردن ربات چت، برای پرسیدن سؤالهای روشنکننده، جمینی را قطع کنند و در زمان واقعی با الگوهای گفتاری آنها سازگار میشود. و Gemini میتواند محیط اطراف کاربران را ببیند و به آنها پاسخ دهد، چه از طریق عکسها یا ویدیوهایی که توسط دوربین گوشیهای هوشمندشان گرفته شده است.
Live همچنین برای خدمت به عنوان یک مربی مجازی طراحی شده است و به کاربران کمک می کند تا برای رویدادها، ایده های طوفان فکری و غیره تمرین کنند. به عنوان مثال، Live میتواند مهارتهایی را که در مصاحبههای شغلی یا کارآموزی آینده برجسته شود، پیشنهاد میکند و میتواند توصیههای سخنرانی عمومی را ارائه دهد.
مدل های جمینی چه کاری می توانند انجام دهند؟
از آنجایی که مدلهای Gemini چندوجهی هستند، میتوانند طیف وسیعی از وظایف چندوجهی را انجام دهند. از رونویسی گفتار گرفته تا نوشتن شرح تصاویر و ویدیوها در زمان واقعی. بسیاری از این قابلیتها به مرحله تولید رسیدهاند (همانطور که در بخش قبل به آن اشاره شد)، و گوگل در آیندهای نه چندان دور وعدههای بسیار بیشتری را میدهد.
البته، پذیرفتن حرف شرکت کمی سخت است. گوگل با عرضه اولیه Bard به طور جدی کم عرضه شد. اخیراً، با ویدئویی که ادعا میکرد قابلیتهای جمینی را نشان میدهد، پرها را به هم زد که کم و بیش آرزومند بود، زنده نبود. دارای ویژگی تولید تصویر بود که به طرز توهینآمیزی نادرست بود. همچنین، گوگل هیچ راه حلی برای برخی از مشکلات اساسی فناوری هوش مصنوعی مولد امروزی ارائه نمی دهد. مانند تعصبات رمزگذاری شده و تمایل به ساختن چیزها (یعنی توهم). رقبای آن نیز این کار را نمیکنند، اما هنگام استفاده از جمینی یا پرداخت هزینه آن باید به خاطر داشته باشید.
برای اهداف این مقاله فرض کنیم که گوگل در مورد ادعاهای اخیر خود صادق است، در اینجا آنچه که سطوح مختلف Gemini می توانند در حال حاضر انجام دهند و زمانی که به پتانسیل کامل خود برسند می توانند انجام دهند، آمده است:
بیشتر بخوانید📘📘📘📘👈👈👈👈 » استفاده از هوش مصنوعی
کارهایی که می توانید با Gemini Ultra انجام دهید
گوگل می گوید که Gemini Ultra – به لطف چندوجهی بودن آن – می تواند برای کمک به مواردی مانند تکالیف فیزیک، حل مسائل گام به گام در یک کاربرگ و اشاره به اشتباهات احتمالی در پاسخ های از قبل پر شده استفاده شود.
Ultra همچنین می تواند برای کارهایی مانند شناسایی مقالات علمی مرتبط با یک مشکل اعمال شود. به عنوان مثال، این مدل می تواند اطلاعات را از چندین مقاله استخراج کند . با ایجاد فرمول های لازم برای ایجاد مجدد نمودار با داده های به موقع تر، نموداری را از یکی به روز کند.
Gemini Ultra از نظر فنی از تولید تصویر پشتیبانی می کند. اما این قابلیت هنوز به نسخه تولید شده این مدل راه پیدا نکرده است . شاید به این دلیل که مکانیسم پیچیده تر از نحوه تولید تصاویر برنامه هایی مانند ChatGPT است. جمینی بهجای درخواستهای خوراک به یک تولیدکننده تصویر (مانند DALL-E 3، در مورد ChatGPT)، تصاویر را بهصورت «بومی» و بدون مرحلهای میانجی خروجی میدهد.
Ultra بهعنوان یک API از طریق Vertex AI، پلتفرم توسعهدهندگان هوش مصنوعی کاملاً مدیریتشده Google، و AI Studio، ابزار مبتنی بر وب Google برای توسعهدهندگان برنامهها و پلتفرمها در دسترس است. همچنین برنامههای Gemini Google را تقویت میکند، اما نه رایگان. یک بار دیگر، دسترسی به Ultra از طریق هر برنامه Gemini مستلزم اشتراک در برنامه AI Premium است.
قابلیت های Gemini Pro
گوگل می گوید که Gemini Pro نسبت به LaMDA در توانایی های استدلال، برنامه ریزی و درک آن پیشرفت کرده است. گوگل ادعا می کند که آخرین نسخه، Gemini 1.5 Pro، در برخی زمینه ها از عملکرد Ultra نیز فراتر رفته است.
Gemini 1.5 Pro در بسیاری از زمینه ها در مقایسه با نسخه قبلی خود، Gemini 1.0 Pro بهبود یافته است، شاید واضح تر از همه در میزان داده هایی که می تواند پردازش کند. Gemini 1.5 Pro میتواند تا 1.4 میلیون کلمه، دو ساعت ویدیو یا 22 ساعت صدا داشته باشد و درباره همه این دادهها استدلال کند یا به سؤالات پاسخ دهد.
1.5 Pro به طور کلی در Vertex AI و AI Studio در ماه ژوئن همراه با قابلیتی به نام اجرای کد در دسترس قرار گرفت که هدف آن کاهش اشکالات کدی است که مدل با اصلاح مکرر آن کد طی چندین مرحله ایجاد می کند. (اجرای کد نیز از Gemini Flash پشتیبانی می کند.)
AI Studio قالب هایی را برای ایجاد اعلان های چت ساختاریافته با Pro ارائه می دهد. توسعهدهندگان میتوانند محدوده خلاقانه مدل را کنترل کنند و مثالهایی برای ارائه دستورالعملهای لحن و سبک ارائه دهند – و همچنین تنظیمات ایمنی Pro را تنظیم کنند.
فلش جمینی برای کاربرانی است که نیاز کمتری دارند
برای برنامه های کاربردی کمتر، Gemini Flash وجود دارد. جدیدترین نسخه 1.5 فلش است. فلش که شاخهای از Gemini Pro است. که کوچک و کارآمد است . برای بارهای کاری باریک و با فرکانس بالا مولد هوش مصنوعی ساخته شده است. مانند Gemini Pro چندوجهی است. به این معنی که میتواند صدا، ویدئو و تصاویر و همچنین متن را تجزیه و تحلیل کند (اما فقط متن تولید میکند).
گوگل میگوید فلش بهویژه برای کارهایی مانند خلاصهسازی، برنامههای چت، شرح تصاویر و ویدیوها و استخراج دادهها از اسناد و جداول طولانی بسیار مناسب است. به طور کلی تا اواسط ژوئیه از طریق Vertex AI و AI Studio در دسترس خواهد بود.
برنامهنویسهایی که از Flash و Pro استفاده میکنند میتوانند به صورت اختیاری از ذخیرهسازی متن استفاده کنند. که به آنها امکان میدهد مقادیر زیادی از اطلاعات (مثلاً پایگاه دانش یا پایگاه داده مقالات تحقیقاتی) را در حافظه پنهانی ذخیره کنند. که مدلهای Gemini میتوانند به سرعت و نسبتاً ارزان به آن دسترسی داشته باشند. با این حال، ذخیره متن یک هزینه اضافی در کنار سایر هزینههای استفاده از مدل Gemini است.
Gemini Nano می تواند روی گوشی شما اجرا شود
گوگل جمینی نانو نسخه بسیار کوچکتری از مدلهای Gemini Pro و Ultra است و به اندازهای کارآمد است که بهجای ارسال کار به سرور در جایی، مستقیماً روی (برخی) تلفنها اجرا شود. تا کنون، نانو چند ویژگی را در پیکسل 8 پرو، پیکسل 8 و سامسونگ گلکسی اس 24، از جمله خلاصه کردن در ضبط و پاسخ هوشمند در جیبورد، تقویت میکند.
برنامه Recorder که به کاربران اجازه میدهد دکمهای را برای ضبط و رونویسی صدا فشار دهند، شامل خلاصهای از مکالمات ضبطشده، مصاحبهها، ارائهها و سایر قطعههای صوتی با پشتیبانی از Gemini است. کاربران حتی اگر سیگنال یا اتصال Wi-Fi نداشته باشند، خلاصه میشوند – و با اشاره به حفظ حریم خصوصی، هیچ دادهای از تلفن آنها خارج نمیشود.
Nano همچنین در Gboard، جایگزین صفحه کلید گوگل است. در آنجا، قابلیتی به نام «پاسخ هوشمند» را تقویت میکند، که به شما کمک میکند تا چیز بعدی را که میخواهید هنگام مکالمه در یک برنامه پیامرسانی بگویید، پیشنهاد کنید. گوگل میگوید این ویژگی در ابتدا فقط با واتساپ کار میکند، اما به مرور زمان به اپلیکیشنهای بیشتری نیز میرسد. در برنامه پیامهای Google در دستگاههای پشتیبانیشده، Nano درایوهای Magic Compose را اجرا میکند که میتواند پیامهایی را به سبکهایی مانند «هیجانانگیز»، «رسمی» و «غزلی» ایجاد کند.
گوگل می گوید که نسخه آینده اندروید روی Nano ضربه می زند تا کاربران را از کلاهبرداری های احتمالی در طول تماس آگاه کند. و به زودی، TalkBack، سرویس دسترسی گوگل، از Nano برای ایجاد توضیحات شنیداری از اشیاء برای کاربران کم بینا و نابینا استفاده خواهد کرد.
آیا گوگل جمینی بهتر از GPT-4 OpenAI است؟
گوگل چندین بار برتری Gemini در معیارها را تبلیغ کرده است و ادعا کرده است که Gemini Ultra در «30 معیار از 32 معیار آکادمیک پرکاربرد مورد استفاده در تحقیق و توسعه مدل های زبانی بزرگ، از نتایج پیشرفته فعلی فراتر رفته است». اما با کنار گذاشتن این سوال که آیا معیارها واقعاً مدل بهتری را نشان میدهند، امتیازاتی که گوگل به آن اشاره میکند به نظر میرسد تا حدی بهتر از مدلهای GPT-4 OpenAI است.
در عین حال، آخرین مدل پرچمدار OpenAI، GPT-4o، در ارزیابی متن، درک بصری و عملکرد ترجمه صوتی بسیار از 1.5 Pro جلوتر است. غزل کلود 3.5 آنتروپیک هر دو را شکست می دهد – اما شاید برای مدت طولانی، با توجه به سرعت سرسام آور صنعت هوش مصنوعی.
بیشتر بخوانید📘📘📘📘👈👈👈👈 » ساخت سایت با هوش مصنوعی
قیمت مدل های جمینی چقدر است؟
Gemini 1.0 Pro (نسخه اول Gemini Pro)، 1.5 Pro و Flash از طریق Google’s Gemini API برای ساخت برنامهها و خدمات، همه با گزینههای رایگان در دسترس هستند. اما گزینههای رایگان محدودیتهای استفاده را تحمیل میکنند و برخی از ویژگیها مانند ذخیرهسازی متن را کنار میگذارند.
در غیر این صورت، مدلهای جمینی پرداختی هستند. در اینجا قیمت پایه (بدون احتساب افزونه هایی مانند ذخیره متنی) تا ژوئن 2024 آمده است:
Gemini 1.0 Pro: 50 سنت به ازای هر 1 میلیون توکن ورودی، 1.50 دلار به ازای هر 1 میلیون توکن خروجی
Gemini 1.5 Pro: 3.05 دلار به ازای هر 1 میلیون توکن ورودی (برای درخواست تا 128000 توکن) یا 7 دلار به ازای هر 1 میلیون توکن (برای درخواست های بیشتر از 128000 توکن). 10.50 دلار به ازای هر 1 میلیون توکن (برای درخواست های تا 128000 توکن) یا 21.00 دلار به ازای هر 1 میلیون توکن (برای درخواست های بیشتر از 128000)