Форма представления | Статьи в российских журналах и сборниках |
Год публикации | 2013 |
|
Лернер Эдуард Юльевич, автор
|
Библиографическое описание на языке оригинала |
Проверка закона Хипса по данным корпуса Google Books Ngram.
Ученые записки Казанского университета. Серия Физ.-мат. Науки, 2013. Том 155, Кн. 4, стр. 16-23 |
Аннотация |
Работа посвящена проверке выполнения эмпирического закона Хипса в европейских языках на материале корпуса текстов Google Books Ngram. Показано, что закон Хипса выполняется лишь для текстов ограниченного объёма и относящихся к небольшому историческому интервалу; показатель Хипса убывает со временем, а также испытывает значительные колебания с характерными временами 60?100 лет. В рамках простой вероятностной модели порождения текста рассмотрена связь между распределением частот словоупотребления и ожидаемой зависимостью числа уникальных слов в тексте от объёма текста. Эта модель даёт объяснение наблюдаемого нисходящего тренда показателя Хипса. |
Ключевые слова |
Закон Хипса, закон Ципфа, вероятностные модели текста, корпус Google Books Ngram.
Summ |
Название журнала |
Уч. записки Казанского госуниверситета
|
URL |
http://old.kpfu.ru/uz_r/bin_files2/155_4_phys-mat_2.pdf |
Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на эту карточку |
https://repository.kpfu.ru/?p_id=95308 |
Полная запись метаданных |
Поле DC |
Значение |
Язык |
dc.contributor.author |
Лернер Эдуард Юльевич |
ru_RU |
dc.date.accessioned |
2013-01-01T00:00:00Z |
ru_RU |
dc.date.available |
2013-01-01T00:00:00Z |
ru_RU |
dc.date.issued |
2013 |
ru_RU |
dc.identifier.citation |
Проверка закона Хипса по данным корпуса Google Books Ngram.
Ученые записки Казанского университета. Серия Физ.-мат. Науки, 2013. Том 155, Кн. 4, стр. 16-23 |
ru_RU |
dc.identifier.uri |
https://repository.kpfu.ru/?p_id=95308 |
ru_RU |
dc.description.abstract |
Уч. записки Казанского госуниверситета |
ru_RU |
dc.description.abstract |
Работа посвящена проверке выполнения эмпирического закона Хипса в европейских языках на материале корпуса текстов Google Books Ngram. Показано, что закон Хипса выполняется лишь для текстов ограниченного объёма и относящихся к небольшому историческому интервалу; показатель Хипса убывает со временем, а также испытывает значительные колебания с характерными временами 60?100 лет. В рамках простой вероятностной модели порождения текста рассмотрена связь между распределением частот словоупотребления и ожидаемой зависимостью числа уникальных слов в тексте от объёма текста. Эта модель даёт объяснение наблюдаемого нисходящего тренда показателя Хипса. |
ru_RU |
dc.language.iso |
ru |
ru_RU |
dc.subject |
Закон Хипса |
ru_RU |
dc.subject |
закон Ципфа |
ru_RU |
dc.subject |
вероятностные модели текста |
ru_RU |
dc.subject |
корпус Google Books Ngram.
Summ |
ru_RU |
dc.title |
Проверка закона Хипса по данным корпуса Google Books Ngram |
ru_RU |
dc.type |
Статьи в российских журналах и сборниках |
ru_RU |
|