Казанский (Приволжский) федеральный университет, КФУ
КАЗАНСКИЙ
ФЕДЕРАЛЬНЫЙ УНИВЕРСИТЕТ
 
ПРОВЕРКА ЗАКОНА ХИПСА ПО ДАННЫМ КОРПУСА GOOGLE BOOKS NGRAM
Форма представленияСтатьи в российских журналах и сборниках
Год публикации2013
  • Лернер Эдуард Юльевич, автор
  • Библиографическое описание на языке оригинала Проверка закона Хипса по данным корпуса Google Books Ngram. Ученые записки Казанского университета. Серия Физ.-мат. Науки, 2013. Том 155, Кн. 4, стр. 16-23
    Аннотация Работа посвящена проверке выполнения эмпирического закона Хипса в европейских языках на материале корпуса текстов Google Books Ngram. Показано, что закон Хипса выполняется лишь для текстов ограниченного объёма и относящихся к небольшому историческому интервалу; показатель Хипса убывает со временем, а также испытывает значительные колебания с характерными временами 60?100 лет. В рамках простой вероятностной модели порождения текста рассмотрена связь между распределением частот словоупотребления и ожидаемой зависимостью числа уникальных слов в тексте от объёма текста. Эта модель даёт объяснение наблюдаемого нисходящего тренда показателя Хипса.
    Ключевые слова Закон Хипса, закон Ципфа, вероятностные модели текста, корпус Google Books Ngram. Summ
    Название журнала Уч. записки Казанского госуниверситета
    URL http://old.kpfu.ru/uz_r/bin_files2/155_4_phys-mat_2.pdf
    Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на эту карточку https://repository.kpfu.ru/?p_id=95308

    Полная запись метаданных