Русская Википедия:Генеративный искусственный интеллект
Генеративный искусственный интеллект — это тип системы искусственного интеллекта (ИИ), способной генерировать текст, изображения или другие медиаданные в ответ на подсказки[1][2]. Генеративный ИИ использует генеративные модели, такие как большие языковые модели, для статистической выборки новых данных на основе набора обучающих данных, который использовался для их создания[3].
Известные системы генеративного ИИ включают ChatGPT — чат-бот, созданный OpenAI с использованием больших языковых моделей GPT-3 и GPT-4[4] и Bard — чат-бот, созданный Google с использованием модели LaMDA[5]. Другие генеративные модели ИИ включают художественные системы искусственного интеллекта, такие как Stable Diffusion и DALL-E[6].
Генеративный ИИ может применяться в самых разных отраслях, включая разработку программного обеспечения, маркетинг и моду[7][8]. Инвестиции в генеративный ИИ резко выросли в начале 2020-х годов, когда крупные компании, такие как Microsoft, Google и Baidu, а также многочисленные более мелкие фирмы разрабатывали модели генеративного ИИ[1][9][10].
Модальности
Генеративная система искусственного интеллекта строится путём применения обучения без учителя или самообучения ИИ на наборе данных. Возможности генеративной системы ИИ зависят от модальности или типа используемого набора данных.
- Текст: генеративные системы ИИ, обученные на словах или словесных токенах, включают GPT-3, LaMDA, LLaMA, BLOOM, GPT-4 и другие (см. Список больших языковых моделей). Они способны к обработке естественного языка, машинному переводу и генерации естественного языка и могут использоваться в качестве базовых моделей для других задач[11]. Наборы данных включают BookCorpus, Wikipedia и другие (см. Список корпусов текстов).
- Код: в дополнение к тексту на естественном языке большие языковые модели можно обучать на текстах написанных на каком-нибудь языке программирования, что позволяет им генерировать исходный код для новых компьютерных программ[12]. Примеры включают OpenAI Codex.
- Изображения: системы генеративного ИИ, обученные на наборах изображений с текстовыми подписями, включают такие, как Imagen, DALL-E, Midjourney, Stable Diffusion и другие (см. Художественные системы искусственного интеллекта, генеративное искусство. Они обычно используются для преобразования текста в изображение и передачи нейронного стиля[13]. Наборы данных включают LAION-5B и другие (см. Наборы данных в компьютерном зрении).
- Молекулы: системы генеративного ИИ можно обучать последовательностям аминокислот или молекулярным представлениям, таким как SMILES, изображающим ДНК или белки. Эти системы, такие как AlphaFold, используются для прогнозирования структуры белков и открытия лекарств[14]. Наборы данных включают в себя различные наборы биологических данных.
- Мультимодальность: генеративную систему ИИ можно построить из нескольких генеративных моделей или одной модели, обученной на нескольких типах данных. Например, одна версия OpenAI GPT-4 принимает ввод как текста, так и изображения[15].
Примечания