Английская Википедия:Gemini (language model)

Gemini is a family of multimodal large language models developed by Google DeepMind, serving as the successor to LaMDA and PaLM 2. Comprising Gemini Ultra, Gemini Pro, and Gemini Nano, it was announced on December 6, 2023, positioned as a competitor to OpenAI's GPT-4. It powers the generative artificial intelligence chatbot of the same name.

History

Development

Шаблон:Further Шаблон:Multiple image

Google announced Gemini, a large language model (LLM) developed by subsidiary Google DeepMind, during the Google I/O keynote on May 10, 2023. It was positioned as a more powerful successor to PaLM 2, which was also unveiled at the event, with Google CEO Sundar Pichai stating that Gemini was still in its early developmental stages.^[1]^[2] Unlike other LLMs, Gemini was said to be unique in that it was not trained on a text corpus alone and was designed to be multimodal, meaning it could process multiple types of data simultaneously, including text, images, audio, video, and computer code.^[3] It had been developed as a collaboration between DeepMind and Google Brain, two branches of Google that had been merged as Google DeepMind the previous month.^[4] In an interview with Wired, DeepMind CEO Demis Hassabis touted Gemini's advanced capabilities, which he believed would allow the algorithm to trump OpenAI's ChatGPT, which runs on GPT-4 and whose growing popularity had been aggressively challenged by Google with LaMDA and Bard. Hassabis highlighted the strengths of DeepMind's AlphaGo program, which gained worldwide attention in 2016 when it defeated Go champion Lee Sedol, saying that Gemini would combine the power of AlphaGo and other Google–DeepMind LLMs.^[5]

In August 2023, The Information published a report outlining Google's roadmap for Gemini, revealing that the company was targeting a launch date of late 2023. According to the report, Google hoped to surpass OpenAI and other competitors by combining conversational text capabilities present in most LLMs with artificial intelligence–powered image generation, allowing it to create contextual images and be adapted for a wider range of use cases.^[6] Like Bard,^[7] Google co-founder Sergey Brin was summoned out of retirement to assist in the development of Gemini, along with hundreds of other engineers from Google Brain and DeepMind;^[6]^[8] he was later credited as a "core contributor" to Gemini.^[9] Because Gemini was being trained on transcripts of YouTube videos, lawyers were brought in to filter out any potentially copyrighted materials.^[6]

With news of Gemini's impending launch, OpenAI hastened its work on integrating GPT-4 with multimodal features similar to those of Gemini.^[10] The Information reported in September that several companies had been granted early access to "an early version" of the LLM, which Google intended to make available to clients through Google Cloud's Vertex AI service. The publication also stated that Google was arming Gemini to compete with both GPT-4 and Microsoft's GitHub Copilot.^[11]^[12]

Launch

On December 6, 2023, Pichai and Hassabis announced "Gemini 1.0" at a virtual press conference.^[13]^[14] It comprised three models: Gemini Ultra, designed for "highly complex tasks"; Gemini Pro, designed for "a wide range of tasks"; and Gemini Nano, designed for "on-device tasks". At launch, Gemini Pro and Nano were integrated into Bard and the Pixel 8 Pro smartphone, respectively, while Gemini Ultra was set to power "Bard Advanced" and become available to software developers in early 2024. Other products that Google intended to incorporate Gemini into included Search, Ads, Chrome, Duet AI on Google Workspace, and AlphaCode 2.^[15]^[14] It was made available only in English.^[14]^[16] Touted as Google's "largest and most capable AI model" and designed to emulate human behavior,^[17]^[14]^[18] the company stated that Gemini would not be made widely available until the following year due to the need for "extensive safety testing".^[13] Gemini was trained on and powered by Google's Tensor Processing Units (TPUs),^[13]^[16] and the name is in reference to the DeepMind–Google Brain merger as well as NASA's Project Gemini.^[19]

Gemini Ultra was said to have outperformed GPT-4, Anthropic's Claude 2, Inflection AI's Inflection-2, Meta's LLaMA 2, and xAI's Grok 1 on a variety of industry benchmarks,^[20]^[13] while Gemini Pro was said to have outperformed GPT-3.5.^[3] Gemini Ultra was also the first language model to outperform human experts on the 57-subject Massive Multitask Language Understanding (MMLU) test, obtaining a score of 90%.^[3]^[19] Gemini Pro was made available to Google Cloud customers on AI Studio and Vertex AI on December 13, while Gemini Nano will be made available to Android developers as well.^[21]^[22]^[23] Hassabis further revealed that DeepMind was exploring how Gemini could be "combined with robotics to physically interact with the world".^[24] In accordance with an executive order signed by U.S. President Joe Biden in October, Google stated that it would share testing results of Gemini Ultra with the federal government of the United States. Similarly, the company was engaged in discussions with the government of the United Kingdom to comply with the principles laid out at the AI Safety Summit at Bletchley Park in November.^[3]

Updates

Google partnered with Samsung to integrate Gemini Nano and Gemini Pro into its Galaxy S24 smartphone lineup in January 2024.^[25]^[26] The following month, Bard and Duet AI were unified under the Gemini brand,^[27]^[28] with "Gemini Advanced with Ultra 1.0" debuting via a new "AI Premium" tier of the Google One subscription service.^[29] Gemini Pro also received a global launch.^[30]

In February, Google launched "Gemini 1.5" in a limited capacity, positioned as a more powerful and capable model than 1.0 Ultra.^[31]^[32]^[33] This "step change" was achieved through various technical advancements, including a new architecture, a mixture-of-experts approach, and a larger one-million-token context window, which equates to roughly an hour of silent video, 11 hours of audio, 30,000 lines of code, or 700,000 words.^[34] The same month, Google debuted Gemma, a family of free and open-source LLMs that serve as a lightweight version of Gemini. They come in two sizes, with a neural network with two and seven billion parameters, respectively. Multiple publications viewed this as an response to Meta and others open-sourcing their AI models, and a stark reversal from Google's longstanding practice of keeping its AI proprietary.^[35]^[36]^[37]

Technical specifications

The first generation of Gemini ("Gemini 1") has three models, with the same software architecture. They are decoder-only transformers, with modifications to allow efficient training and inference on TPUs. They have a context length of 32,768 tokens, with multi-query attention. Two versions of Gemini Nano, Nano-1 (1.8 billion parameters) and Nano-2 (3.25 billion parameters), are distilled from larger Gemini models, designed for use by edge devices such as smartphones. As Gemini is multimodal, each context window can contain multiple forms of input. The different modes can be interleaved and do not have to be presented in a fixed order, allowing for a multimodal conversation. Input images may be of different resolutions, while video is inputted as a sequence of images. Audio is sampled at 16 kHz and then converted into a sequence of tokens by the Universal Speech Model. Gemini's dataset is multimodal and multilingual, consisting of "web documents, books, and code, and includ[ing] image, audio, and video data".^[38]

Demis Hassabis claims that training Gemini 1 used "roughly the same amount of compute, maybe slightly more than what was rumored for GPT-4".^[39]

The second generation of Gemini ("Gemini 1.5") has one model published so far: Gemini 1.5 Pro. It is a multimodal sparse mixture-of-experts, with context length of "multiple millions".^[40]

Reception

Gemini's launch was preluded by months of intense speculation and anticipation, which MIT Technology Review described as "peak AI hype".^[41]^[20] In August 2023, Dylan Patel and Daniel Nishball of research firm SemiAnalysis penned a blog post declaring that the release of Gemini would "eat the world" and outclass GPT-4, prompting OpenAI CEO Sam Altman to ridicule the duo on X (formerly Twitter).^[42]^[43] Business magnate Elon Musk, who co-founded OpenAI, weighed in, asking, "Are the numbers wrong?"^[44] Hugh Langley of Business Insider remarked that Gemini would be a make-or-break moment for Google, writing: "If Gemini dazzles, it will help Google change the narrative that it was blindsided by Microsoft and OpenAI. If it disappoints, it will embolden critics who say Google has fallen behind."^[45]

Reacting to its unveiling in December 2023, University of Washington professor emeritus Oren Etzioni predicted a "tit-for-tat arms race" between Google and OpenAI. Professor Alexei Efros of the University of California, Berkeley praised the potential of Gemini's multimodal approach,^[19] while scientist Melanie Mitchell of the Santa Fe Institute called Gemini "very sophisticated". Professor Chirag Shah of the University of Washington was less impressed, likening Gemini's launch to the routineness of Apple's annual introduction of a new iPhone. Similarly, Stanford University's Percy Liang, the University of Washington's Emily Bender, and the University of Galway's Michael Madden cautioned that it was difficult to interpret benchmark scores without insight into the training data used.^[41]^[46] Writing for Fast Company, Mark Sullivan opined that Google had the opportunity to challenge the iPhone's dominant market share, believing that Apple was unlikely to have the capacity to develop functionality similar to Gemini with its Siri virtual assistant.^[47] Google shares spiked by 5.3 percent the day after Gemini's launch.^[48]^[49]

Google faced criticism for a demonstrative video of Gemini, which was not conducted in real time.^[50]

References

Шаблон:Reflist

External links

Шаблон:Google AI Шаблон:Google LLC Шаблон:Differentiable computing Шаблон:Natural language processing Шаблон:Google FOSS

↑ Ошибка цитирования Неверный тег <ref>; для сносок IO2023NYT не указан текст
↑ Ошибка цитирования Неверный тег <ref>; для сносок IO2023ZD не указан текст
↑ ^3,0 ^3,1 ^3,2 ^3,3 Ошибка цитирования Неверный тег <ref>; для сносок AnnounceGuardian не указан текст
↑ Ошибка цитирования Неверный тег <ref>; для сносок Google25 не указан текст
↑ Ошибка цитирования Неверный тег <ref>; для сносок HassabisInterview не указан текст
↑ ^6,0 ^6,1 ^6,2 Ошибка цитирования Неверный тег <ref>; для сносок TheInformation не указан текст
↑ Ошибка цитирования Неверный тег <ref>; для сносок LarrySergey не указан текст
↑ Ошибка цитирования Неверный тег <ref>; для сносок BrinReturn не указан текст
↑ Ошибка цитирования Неверный тег <ref>; для сносок CoreContributor не указан текст
↑ Ошибка цитирования Неверный тег <ref>; для сносок Hustle не указан текст
↑ Ошибка цитирования Неверный тег <ref>; для сносок NearLaunch не указан текст
↑ Ошибка цитирования Неверный тег <ref>; для сносок WhatWeKnow не указан текст
↑ ^13,0 ^13,1 ^13,2 ^13,3 Ошибка цитирования Неверный тег <ref>; для сносок AnnounceWSJ не указан текст
↑ ^14,0 ^14,1 ^14,2 ^14,3 Ошибка цитирования Неверный тег <ref>; для сносок AnnounceAP не указан текст
↑ Ошибка цитирования Неверный тег <ref>; для сносок AnnounceArs не указан текст
↑ ^16,0 ^16,1 Ошибка цитирования Неверный тег <ref>; для сносок AnnounceVerge не указан текст
↑ Ошибка цитирования Неверный тег <ref>; для сносок AnnounceCNN не указан текст
↑ Ошибка цитирования Неверный тег <ref>; для сносок AnnounceCBS не указан текст
↑ ^19,0 ^19,1 ^19,2 Ошибка цитирования Неверный тег <ref>; для сносок AnnounceWired не указан текст
↑ ^20,0 ^20,1 Ошибка цитирования Неверный тег <ref>; для сносок AnnounceTime не указан текст
↑ Ошибка цитирования Неверный тег <ref>; для сносок AnnounceNYT не указан текст
↑ Ошибка цитирования Неверный тег <ref>; для сносок AnnounceCNBC не указан текст
↑ Ошибка цитирования Неверный тег <ref>; для сносок AnnounceBloomberg не указан текст
↑ Ошибка цитирования Неверный тег <ref>; для сносок NewBreed не указан текст
↑ Ошибка цитирования Неверный тег <ref>; для сносок S24Bloomberg не указан текст
↑ Ошибка цитирования Неверный тег <ref>; для сносок S24Wired не указан текст
↑ Ошибка цитирования Неверный тег <ref>; для сносок GeminiRebrandNYT не указан текст
↑ Ошибка цитирования Неверный тег <ref>; для сносок GeminiRebrandReuters не указан текст
↑ Ошибка цитирования Неверный тег <ref>; для сносок AIPremium не указан текст
↑ Ошибка цитирования Неверный тег <ref>; для сносок Global не указан текст
↑ Ошибка цитирования Неверный тег <ref>; для сносок 1.5Wired не указан текст
↑ Ошибка цитирования Неверный тег <ref>; для сносок 1.5Forbes не указан текст
↑ Ошибка цитирования Неверный тег <ref>; для сносок 1.5FC не указан текст
↑ Ошибка цитирования Неверный тег <ref>; для сносок 1.5BI не указан текст
↑ Ошибка цитирования Неверный тег <ref>; для сносок GemmaFC не указан текст
↑ Ошибка цитирования Неверный тег <ref>; для сносок GemmaBloomberg не указан текст
↑ Ошибка цитирования Неверный тег <ref>; для сносок GemmaNYT не указан текст
↑ Ошибка цитирования Неверный тег <ref>; для сносок WhitePaper не указан текст
↑ Шаблон:Cite web
↑ Ошибка цитирования Неверный тег <ref>; для сносок WhitePaper_1_5 не указан текст
↑ ^41,0 ^41,1 Ошибка цитирования Неверный тег <ref>; для сносок PeakHype не указан текст
↑ Ошибка цитирования Неверный тег <ref>; для сносок SemiAnalysisBI не указан текст
↑ Ошибка цитирования Неверный тег <ref>; для сносок SemiAnalysisFortune не указан текст
↑ Ошибка цитирования Неверный тег <ref>; для сносок Musk не указан текст
↑ Ошибка цитирования Неверный тег <ref>; для сносок Hsiao не указан текст
↑ Ошибка цитирования Неверный тег <ref>; для сносок Conversation не указан текст
↑ Ошибка цитирования Неверный тег <ref>; для сносок AchillesHeel не указан текст
↑ Ошибка цитирования Неверный тег <ref>; для сносок WallStreetReuters не указан текст
↑ Ошибка цитирования Неверный тег <ref>; для сносок WallStreetMW не указан текст
↑ Шаблон:Cite web

[IO2023NYT-1] Ошибка цитирования Неверный тег <ref>; для сносок IO2023NYT не указан текст

[IO2023ZD-2] Ошибка цитирования Неверный тег <ref>; для сносок IO2023ZD не указан текст

[AnnounceGuardian-3] 3,0 ^3,1 ^3,2 ^3,3 Ошибка цитирования Неверный тег <ref>; для сносок AnnounceGuardian не указан текст

[Google25-4] Ошибка цитирования Неверный тег <ref>; для сносок Google25 не указан текст

[HassabisInterview-5] Ошибка цитирования Неверный тег <ref>; для сносок HassabisInterview не указан текст

[TheInformation-6] 6,0 ^6,1 ^6,2 Ошибка цитирования Неверный тег <ref>; для сносок TheInformation не указан текст

[LarrySergey-7] Ошибка цитирования Неверный тег <ref>; для сносок LarrySergey не указан текст

[BrinReturn-8] Ошибка цитирования Неверный тег <ref>; для сносок BrinReturn не указан текст

[CoreContributor-9] Ошибка цитирования Неверный тег <ref>; для сносок CoreContributor не указан текст

[Hustle-10] Ошибка цитирования Неверный тег <ref>; для сносок Hustle не указан текст

[NearLaunch-11] Ошибка цитирования Неверный тег <ref>; для сносок NearLaunch не указан текст

[WhatWeKnow-12] Ошибка цитирования Неверный тег <ref>; для сносок WhatWeKnow не указан текст

[AnnounceWSJ-13] 13,0 ^13,1 ^13,2 ^13,3 Ошибка цитирования Неверный тег <ref>; для сносок AnnounceWSJ не указан текст

[AnnounceAP-14] 14,0 ^14,1 ^14,2 ^14,3 Ошибка цитирования Неверный тег <ref>; для сносок AnnounceAP не указан текст

[AnnounceArs-15] Ошибка цитирования Неверный тег <ref>; для сносок AnnounceArs не указан текст

[AnnounceVerge-16] 16,0 ^16,1 Ошибка цитирования Неверный тег <ref>; для сносок AnnounceVerge не указан текст

[AnnounceCNN-17] Ошибка цитирования Неверный тег <ref>; для сносок AnnounceCNN не указан текст

[AnnounceCBS-18] Ошибка цитирования Неверный тег <ref>; для сносок AnnounceCBS не указан текст

[AnnounceWired-19] 19,0 ^19,1 ^19,2 Ошибка цитирования Неверный тег <ref>; для сносок AnnounceWired не указан текст

[AnnounceTime-20] 20,0 ^20,1 Ошибка цитирования Неверный тег <ref>; для сносок AnnounceTime не указан текст

[AnnounceNYT-21] Ошибка цитирования Неверный тег <ref>; для сносок AnnounceNYT не указан текст

[AnnounceCNBC-22] Ошибка цитирования Неверный тег <ref>; для сносок AnnounceCNBC не указан текст

[AnnounceBloomberg-23] Ошибка цитирования Неверный тег <ref>; для сносок AnnounceBloomberg не указан текст

[NewBreed-24] Ошибка цитирования Неверный тег <ref>; для сносок NewBreed не указан текст

[S24Bloomberg-25] Ошибка цитирования Неверный тег <ref>; для сносок S24Bloomberg не указан текст

[S24Wired-26] Ошибка цитирования Неверный тег <ref>; для сносок S24Wired не указан текст

[GeminiRebrandNYT-27] Ошибка цитирования Неверный тег <ref>; для сносок GeminiRebrandNYT не указан текст

[GeminiRebrandReuters-28] Ошибка цитирования Неверный тег <ref>; для сносок GeminiRebrandReuters не указан текст

[AIPremium-29] Ошибка цитирования Неверный тег <ref>; для сносок AIPremium не указан текст

[Global-30] Ошибка цитирования Неверный тег <ref>; для сносок Global не указан текст

[1.5Wired-31] Ошибка цитирования Неверный тег <ref>; для сносок 1.5Wired не указан текст

[1.5Forbes-32] Ошибка цитирования Неверный тег <ref>; для сносок 1.5Forbes не указан текст

[1.5FC-33] Ошибка цитирования Неверный тег <ref>; для сносок 1.5FC не указан текст

[1.5BI-34] Ошибка цитирования Неверный тег <ref>; для сносок 1.5BI не указан текст

[GemmaFC-35] Ошибка цитирования Неверный тег <ref>; для сносок GemmaFC не указан текст

[GemmaBloomberg-36] Ошибка цитирования Неверный тег <ref>; для сносок GemmaBloomberg не указан текст

[GemmaNYT-37] Ошибка цитирования Неверный тег <ref>; для сносок GemmaNYT не указан текст

[WhitePaper-38] Ошибка цитирования Неверный тег <ref>; для сносок WhitePaper не указан текст

[39] Шаблон:Cite web

[WhitePaper_1_5-40] Ошибка цитирования Неверный тег <ref>; для сносок WhitePaper_1_5 не указан текст

[PeakHype-41] 41,0 ^41,1 Ошибка цитирования Неверный тег <ref>; для сносок PeakHype не указан текст

[SemiAnalysisBI-42] Ошибка цитирования Неверный тег <ref>; для сносок SemiAnalysisBI не указан текст

[SemiAnalysisFortune-43] Ошибка цитирования Неверный тег <ref>; для сносок SemiAnalysisFortune не указан текст

[Musk-44] Ошибка цитирования Неверный тег <ref>; для сносок Musk не указан текст

[Hsiao-45] Ошибка цитирования Неверный тег <ref>; для сносок Hsiao не указан текст

[Conversation-46] Ошибка цитирования Неверный тег <ref>; для сносок Conversation не указан текст

[AchillesHeel-47] Ошибка цитирования Неверный тег <ref>; для сносок AchillesHeel не указан текст

[WallStreetReuters-48] Ошибка цитирования Неверный тег <ref>; для сносок WallStreetReuters не указан текст

[WallStreetMW-49] Ошибка цитирования Неверный тег <ref>; для сносок WallStreetMW не указан текст

[50] Шаблон:Cite web

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]

[31]

[32]

[33]

[34]

[35]

[36]

[37]

[38]

[39]

[40]

[41]

[42]

[43]

[44]

[45]

[46]

[47]

[48]

[49]

[50]

Партнерские ресурсы
Криптовалюты	Обмен криптовалют - www.bestchange.ru Криптовалютная биржа CoinEx Криптовалютная биржа Binance HIVE OS - операционная система для майнинга e4pool - Мультивалютный пул для майнинга.
Магазины	AliExpress — глобальная виртуальная (в Интернете) торговая площадка, предоставляющая возможность покупать товары производителей из КНР; computeruniverse.net - Интернет-магазин компьютеров(Промо код 5 Евро на первую покупку:FWWC3ZKQ);
Хостинг	DigitalOcean - американский провайдер облачных инфраструктур, с главным офисом в Нью-Йорке и с центрами обработки данных по всему миру;
Разное	Викиум - Онлайн-тренажер для мозга Like Центр - Центр поддержки и развития предпринимательства. Gamersbay - лучший магазин по бустингу для World of Warcraft. Ноотропы OmniMind N°1 - Усиливает мозговую активность. Повышает мотивацию. Улучшает память. Санкт-Петербургская школа телевидения - это федеральная сеть образовательных центров, которая имеет филиалы в 37 городах России. Lingualeo.com — интерактивный онлайн-сервис для изучения и практики английского языка в увлекательной игровой форме. Junyschool (Джунискул) – международная школа программирования и дизайна для детей и подростков от 5 до 17 лет, где ученики осваивают компьютерную грамотность, развивают алгоритмическое и креативное мышление, изучают основы программирования и компьютерной графики, создают собственные проекты: игры, сайты, программы, приложения, анимации, 3D-модели, монтируют видео. Умназия - Интерактивные онлайн-курсы и тренажеры для развития мышления детей 6-13 лет SkillBox - это один из лидеров российского рынка онлайн-образования. Среди партнеров Skillbox ведущий разработчик сервисного дизайна AIC, медиа-компания Yoola, первое и самое крупное русскоязычное аналитическое агентство Tagline, онлайн-школа дизайна и иллюстрации Bang! Bang! Education, оператор PR-рынка PACO, студия рисования Draw&Go, агентство performance-маркетинга Ingate, scrum-студия Sibirix, имидж-лаборатория Персона. «Нетология» — это университет по подготовке и дополнительному обучению специалистов в области интернет-маркетинга, управления проектами и продуктами, дизайна, Data Science и разработки. В рамках Нетологии студенты получают ценные теоретические знания от лучших экспертов Рунета, выполняют практические задания на отработку полученных навыков, общаются с экспертами и единомышленниками. Познакомиться со всеми продуктами подробнее можно на сайте https://netology.ru, линейка курсов и профессий постоянно обновляется. StudyBay Brazil – это онлайн биржа для португалоговорящих студентов и авторов! Студент получает уникальную работу любого уровня сложности и больше свободного времени, в то время как у автора появляется дополнительный заработок и бесценный опыт. Автор24 — самая большая в России площадка по написанию учебных работ: контрольные и курсовые работы, дипломы, рефераты, решение задач, отчеты по практике, а так же любой другой вид работы. Сервис сотрудничает с более 70 000 авторов. Более 1 000 000 работ уже выполнено. StudyBay – это онлайн биржа для англоязычных студентов и авторов! Студент получает уникальную работу любого уровня сложности и больше свободного времени, в то время как у автора появляется дополнительный заработок и бесценный опыт.

Английская Википедия:Gemini (language model)

Содержание

History

Development

Launch

Updates

Technical specifications

Reception

See also

References

Further reading

External links

Навигация

Действия на странице

Действия на странице

Персональные инструменты

Навигация

Поиск

Инструменты