Ngram viewer
Автор Кислый задал вопрос в разделе Интернет
Что такое Google Ngram? и получил лучший ответ
Ответ от Абстр@кциЯ V.I.[гуру]
В недрах Google Labs на свет родился мощный сервис NGram, который перебирает исполинскую базу оцифрованных книг Google и позволяет выявить частоту употребления слов и фраз в книгах в разные исторические периоды.
Google Ngram Viewer: Сталин популярнее Ленина, а слово Интернет появилось в конце 19 века.
таковы расчеты сервиса Books Ngram Viewer — новой филологической онлайн-игрушки от корпорации Google.
Крупнейший мировой поисковик прогнал через свои фильтры все литературное наследие человечества за последние 200 лет. Что из этого получилось, рассказывается в очередном выпуске научно-популярной программы «Инфомания» , которая выходит на канале СТС.
«Откуда в 19-м веке слово „интернет“?» — недоумевают пользователи нового сервиса Books Ngram Viewer, которые обнаружили первые сообщения о глобальной Сети в далеких 1890-х годах. «В любой системе есть погрешности» , — честно отвечают разработчики Google. Впрочем, они тут же добавляют, что у слова «интернет» имеется одно устаревшее значение и предлагают пользователям его найти. Праздные блоггеры бьются над этой задачей уже больше месяца. Лингвистическую программу на платформе поисковика Google запустили гарвардские ученые. Они закачали на сервер около 5 миллионов книг, опубликованных за период c 1800 по 2009 год. Любой желающий теперь может проследить, с какой частотой определенные слова упоминались на протяжении веков.
Поиск доступен на семи языках: английском, французском, немецком, испанском, иврите, русском и упрощенном китайском. Особое место отведено английскому — он здесь подразделяется на «общий» , «художественный» , «британский» и «американский» . Система позволяет проводить сопоставительный анализ — к примеру, Ленин упоминается в литературе на русском языке гораздо чаще, чем Сталин, в том числе и после 2000 года, что легко можно проследить на графике, если ввести эти фамилии через запятую в строку поиска. По этой причине сервис привлек внимание серьезных исследователей — человеку и целой жизни не хватит, чтобы проанализировать 5 миллионов источников, а компьютерная программа проделывает эту операцию за несколько секунд. Под онлайн-сервис в Гарварде придумали и целую науку, которую решили назвать «культуромикой» . Дело в том, что отсканированные книги в основном посвящены вопросам культуры и общества, здесь нет технической литературы. Измерять частоту упоминаний ученые предложили в «миллидарвинах» — согласно графикам Books Ngram Viewer, по популярности Дарвин обгоняет самого Эйнштейна.
Для основной массы пользователей интернета новая услуга от Google стала очередным развлечением, помогающим развеять тоску офисных будней. К примеру, многие юзеры принялись забивать в поиск названия популярных социальных сетей. Английский язык более гибкий и восприимчивый к нововведениям, чем русский: слово Facebook, например, стало нарицательным и даже образовало устоявшуюся глагольную форму, официально включенную в онлайн-словари. «She learned that her current employer Facebooked her before hiring her» — «Она узнала, что нынешний работодатель профэйсбучил ее, прежде чем взять на работу» , — гласит пример употребления в одной из словарных статей.
. ru/4813 ( без пробелов )
<a href="/" rel="nofollow" title="2668:##:https://www.google.ru/#hl=ru&gs_nf=1&cp=12&gs_id=1o&xhr=t&q=Google+Ngram&pf=p&newwindow=1&biw=832&bih=515&sclient=psy-ab&oq=Google+Ngram&aq=0&aqi=g1g-s1g1&aql=&gs_sm=&gs_upl=&gs_l=&pbx=1&bav=on.2,or.r_gc.r_pw.r_cp