Форма представления | Статьи в российских журналах и сборниках |
Год публикации | 2024 |
Язык | русский |
|
Данилова Юлия Юрьевна, автор
|
Библиографическое описание на языке оригинала |
Голиков А.А., Акимов Д.А., Данилова Ю.Ю. Оптимизация традиционных методов определения сходства наименований проектов и закупок с использованием больших языковых моделей // Litera. 2024. № 4. С. 109-121. DOI: 10.25136/2409-8698.2024.4.70455 (ВАК)
|
Аннотация |
Предметом исследования является анализ и совершенствование методов
определения релевантности наименований проектов к информационному содержанию
закупок с использованием больших языковых моделей. Объектом исследования служит
база данных, содержащая наименования проектов и закупок в сфере
электроэнергетики, собранная из открытых источников. Автор подробно рассматривает
такие аспекты темы, как применение метрик TF-IDF и косинусного сходства для
первичной фильтрации данных, а также детально описывает интеграцию и оценку
эффективности больших языковых моделей, таких как GigaChat, GPT-3.5, и GPT-4 в
задачах сопоставления текстовых данных. Особое внимание уделяется методикам
уточнения сходства наименований на основе рефлексии, введенной в промпты больших
языковых моделей, что позволяет повысить точность сопоставления данных. В
исследовании использованы методы TF-IDF и косинусного сходства для первичного
анализа данных, а также большие языковые модели GigaChat, GPT-3.5 и GPT-4 для
детальной проверки релевантности наименований проектов и закупок, включая
рефлексию в промптах моделей для улучшения точности результатов. Предметом исследования является анализ и совершенствование методов
определения релевантности наименований проектов к информационному содержанию
закупок с использованием больших языковых моделей. Объектом исследования служит
база данных, содержащая наименования проектов и закупок в сфере
электроэнергетики, собранная из открытых источников. Автор подробно рассматривает
такие аспекты темы, как применение метрик TF-IDF и косинусного сходства для
первичной фильтрации данных, а также детально описывает интеграцию и оценку
эффективности больших языковых моделей, таких как GigaChat, GPT-3.5, и GPT-4 в
задачах сопоставления текстовых данных. Особое внимание уделяется методикам
уточнения сходства наименований на основе рефлексии, введенной в промпты больших
языковых моделей, что позволяет повысить точность сопоставления данных. В
исследовании использованы методы TF-IDF и косинусного сходства для первичного
анализа данных, а также большие языковые модели GigaChat, GPT-3.5 и GPT-4 для
детальной проверки релевантности наименований проектов и закупок, включая
рефлексию в промптах моделей для улучшения точности результатов. |
Ключевые слова |
T F -I D F, косинусное сходство, большие языковые модели, GigaChat, G P T-4, анализ
текстовых данных, рефлексия в промптах, определение релевантности, проекты и закупки, оптимизация бизнес-процессов |
Название журнала |
Litera
|
URL |
https://nbpublish.com/library_read_article.php?id=70455 |
Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на эту карточку |
https://repository.kpfu.ru/?p_id=307489 |
Полная запись метаданных  |
Поле DC |
Значение |
Язык |
dc.contributor.author |
Данилова Юлия Юрьевна |
ru_RU |
dc.date.accessioned |
2024-01-01T00:00:00Z |
ru_RU |
dc.date.available |
2024-01-01T00:00:00Z |
ru_RU |
dc.date.issued |
2024 |
ru_RU |
dc.identifier.citation |
Голиков А.А., Акимов Д.А., Данилова Ю.Ю. Оптимизация традиционных методов определения сходства наименований проектов и закупок с использованием больших языковых моделей // Litera. 2024. № 4. С. 109-121. DOI: 10.25136/2409-8698.2024.4.70455 (ВАК)
|
ru_RU |
dc.identifier.uri |
https://repository.kpfu.ru/?p_id=307489 |
ru_RU |
dc.description.abstract |
Litera |
ru_RU |
dc.description.abstract |
Предметом исследования является анализ и совершенствование методов
определения релевантности наименований проектов к информационному содержанию
закупок с использованием больших языковых моделей. Объектом исследования служит
база данных, содержащая наименования проектов и закупок в сфере
электроэнергетики, собранная из открытых источников. Автор подробно рассматривает
такие аспекты темы, как применение метрик TF-IDF и косинусного сходства для
первичной фильтрации данных, а также детально описывает интеграцию и оценку
эффективности больших языковых моделей, таких как GigaChat, GPT-3.5, и GPT-4 в
задачах сопоставления текстовых данных. Особое внимание уделяется методикам
уточнения сходства наименований на основе рефлексии, введенной в промпты больших
языковых моделей, что позволяет повысить точность сопоставления данных. В
исследовании использованы методы TF-IDF и косинусного сходства для первичного
анализа данных, а также большие языковые модели GigaChat, GPT-3.5 и GPT-4 для
детальной проверки релевантности наименований проектов и закупок, включая
рефлексию в промптах моделей для улучшения точности результатов. Предметом исследования является анализ и совершенствование методов
определения релевантности наименований проектов к информационному содержанию
закупок с использованием больших языковых моделей. Объектом исследования служит
база данных, содержащая наименования проектов и закупок в сфере
электроэнергетики, собранная из открытых источников. Автор подробно рассматривает
такие аспекты темы, как применение метрик TF-IDF и косинусного сходства для
первичной фильтрации данных, а также детально описывает интеграцию и оценку
эффективности больших языковых моделей, таких как GigaChat, GPT-3.5, и GPT-4 в
задачах сопоставления текстовых данных. Особое внимание уделяется методикам
уточнения сходства наименований на основе рефлексии, введенной в промпты больших
языковых моделей, что позволяет повысить точность сопоставления данных. В
исследовании использованы методы TF-IDF и косинусного сходства для первичного
анализа данных, а также большие языковые модели GigaChat, GPT-3.5 и GPT-4 для
детальной проверки релевантности наименований проектов и закупок, включая
рефлексию в промптах моделей для улучшения точности результатов. |
ru_RU |
dc.language.iso |
ru |
ru_RU |
dc.subject |
T F -I D F |
ru_RU |
dc.subject |
косинусное сходство |
ru_RU |
dc.subject |
большие языковые модели |
ru_RU |
dc.subject |
GigaChat |
ru_RU |
dc.subject |
G P T-4 |
ru_RU |
dc.subject |
анализ
текстовых данных |
ru_RU |
dc.subject |
рефлексия в промптах |
ru_RU |
dc.subject |
определение релевантности |
ru_RU |
dc.subject |
проекты и закупки |
ru_RU |
dc.subject |
оптимизация бизнес-процессов |
ru_RU |
dc.title |
Оптимизация традиционных методов определения сходства наименований проектов и закупок с использованием больших языковых моделей |
ru_RU |
dc.type |
Статьи в российских журналах и сборниках |
ru_RU |
|