Dmitry Kobak (kobak) wrote,
Dmitry Kobak
kobak

Categories:

пицца, паста, суши и мороженое

Гугл собрал гигантский лингвистический корпус из пяти миллионов отсканированных книг за всю историю книгопечатания, и опубликовал в Science (!) статью с претенциозным названием «Quantitative Analysis of Culture Using Millions of Digitized Books». Статья веселая, и состоит из разных смешных графиков, вроде такого:



Графики можно строить и самому по адресу http://ngrams.googlelabs.com (кроме общего английского корпуса, там есть британский и американский по отдельности, а также русский и еще несколько).
Subscribe

  • гвоздь

    Мой друг правовед М. пишет, что в Питере разобрали Большой Петровский мост — деревянный, зеленый, с Крестовского на Петровский. Когда я буду…

  • Новая Голландия (and now for something completely different)

    Историк архитектуры Мильчик рассказывал сегодня по радио про грядущую реконструкцию Новой Голландии. Под его руководством там проводилась…

  • Neighbour embeddings for scientific visualization

    Запись моего доклада (как бы в Гейдельберге, но, увы, через Zoom) о том, что такое neighbour embeddings, как они работают, кому и почему это вообще…

  • Post a new comment

    Error

    default userpic

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 4 comments