По сообщению корреспондента новостного агентства «Хавза», восьмая встреча активистов в области искусственного интеллекта в Куме состоялась утром в четверг, 22 мая 2025 года, по приглашению института «Хамта» (искусственный интеллект и исламская цивилизация).
В ходе этой встречи доктор Бехруз Минаи Бидгели (преподаватель Технологического университета имени Шарифа), подчеркнув важность LLM-моделей и их связь с анализом данных, сказал: «Значение LLM-моделей заключается в огромном объёме данных, с которыми они работают».
Он отметил: «GPT-2 был основан на 40 тысячах книг, однако из-за малого объёма данных имел множество недостатков. GPT-3 в 2023 году потряс мир — он легко и связно создавал тексты и охватывал практически все сферы человеческих знаний, включая фильмы, аудио и тексты. На эти модели были затрачены огромные средства, и в конечном итоге они смогли генерировать контент, приближённый к человеческому. Самая трудоёмкая часть анализа данных — это сбор, очистка данных и подобные задачи. LLM-модели играют серьёзную роль в обработке текста, и даже для создания промптов используют сами LLM. Эти модели осуществляют своего рода постобработку, такую как разметка, редактирование и прочее».
Минаи далее отметил: «Искусственный интеллект не заменит человека. Если мы хотим овладеть ИИ, необходимо обладать знанием и профессиональной подготовкой в различных его аспектах. В конечном итоге ИИ станет помощником, и сочетание человека и ИИ может быть логически обосновано. Между LLM и анализом данных существуют инструменты, способные изменить человеческую жизнь».
В одной из частей своего выступления он также указал на имеющиеся инструменты ИИ для кластеризации контента и сказал: «Кластеризация (clustering) с появлением LLM-моделей претерпит огромные изменения. С их помощью можно осуществлять кластеризацию, при этом анализируя содержимое. То есть модель понимает контент и группирует его на основе содержания, а также выполняет его разметку».
В заключение доктор Минаи сказал: «Создание качественных промптов — это особое умение. Важно понимать, какой промпт приведёт к желаемому результату. На сегодняшний день сами LLM помогают в генерации точных и профессиональных промптов, что значительно способствует как извлечению контента, так и кластеризации».
Ваше мнение