Dmitry Kobak (kobak) wrote,
Dmitry Kobak
kobak

Categories:

пицца, паста, суши и мороженое

Гугл собрал гигантский лингвистический корпус из пяти миллионов отсканированных книг за всю историю книгопечатания, и опубликовал в Science (!) статью с претенциозным названием «Quantitative Analysis of Culture Using Millions of Digitized Books». Статья веселая, и состоит из разных смешных графиков, вроде такого:



Графики можно строить и самому по адресу http://ngrams.googlelabs.com (кроме общего английского корпуса, там есть британский и американский по отдельности, а также русский и еще несколько).
Subscribe

  • росстат выложил данные за январь

    Появление первых данных Росстата за 2021 поломало мой скрипт, и мне так быстро его не починить. Но скрипт по всем странам продолжает работать,…

  • смертность за декабрь

    Выложу только один график, остальное см. на https://github.com/dkobak/excess-mortality. Недоучет немного снизился и в декабре составил 5.5 (см.…

  • пуассон 🐟

    Коллеги, а никто не тестировал ежедневные сводки заболевших и умерших на underdispersion? Не знаю, как это правильно называется по-русски. Мое…

  • Post a new comment

    Error

    default userpic

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 4 comments