Dmitry Kobak (kobak) wrote,
Dmitry Kobak
kobak

Categories:

пицца, паста, суши и мороженое

Гугл собрал гигантский лингвистический корпус из пяти миллионов отсканированных книг за всю историю книгопечатания, и опубликовал в Science (!) статью с претенциозным названием «Quantitative Analysis of Culture Using Millions of Digitized Books». Статья веселая, и состоит из разных смешных графиков, вроде такого:



Графики можно строить и самому по адресу http://ngrams.googlelabs.com (кроме общего английского корпуса, там есть британский и американский по отдельности, а также русский и еще несколько).
Subscribe

Recent Posts from This Journal

  • смерти в россии по неделям

    Я построил график смертей в России по неделям (с 2000 по конец 2020, данные с http://mortality.org), с разбивкой на пол и возраст, и теперь не могу…

  • итоговые результаты выборов 2021

    В продолжение предыдущей записи. Сергей Шпилькин выложил окончательные данные с последних выборов, полученные с помощью деобфускатора Александра…

  • цик зашифровала результаты

    Неясно, когда мы сможем полюбоваться на пики на целых процентах в результатах думских выборов, т.к. ЦИК мало того что поставила на сайт капчу (что…

  • Post a new comment

    Error

    default userpic

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 4 comments