Звуки и знаки - [7]
Десять лет спустя в Таллине вышел «Частотный словарь современного русского литературного языка», составленный Э. А. Штейнфельдт на основании обработки четырехсот тысяч слов.
Однако и этого словаря оказалось недостаточно. Объем текстов, взятых для словаря Штейнфельдт, был невелик. Причем четвертую часть его составляли произведения детской литературы. Естественно, это повлияло и на общую картину: в список частых попали такие слова, как пионер, штаб и т. п.
В 1966 году университет штата Огайо выпустил частотный словарь «разговорного русского языка». Составлен он был на основании обработки пьес. Мы же, как известно, далеко не всегда говорим так, как персонажи пьес классических и даже современных. Вот почему университет дружбы народов имени П. Лумумбы в Москве выпустил в 1968 году свой словарь, более точно отражающий разговорную лексику. В словарь вошло две тысячи триста восемьдесят наиболее употребительных слов русской разговорной речи.
Наконец настал черед и монументального «Частотного словаря русского языка». Такой словарь был издан в нашей стране в 1977 году и занял почти тысячу страниц. Его составителями были сотрудники филологического факультета Ленинградского университета и лаборатории семиотики НИИ прикладной математики и кибернетики при Горьковском университете. С помощью ЭВМ они обработали тексты объемом в миллион слов,
В словаре в алфавитном порядке от союза а до прилагательного ящичный приводится около сорока тысяч различных слов, встречавшихся в тексте. Рядом со словом дана его частота, сначала общая, а затем по основным четырем категориям, на которые были разделены все тексты (художественная проза; драматургия; научные и публицистические тексты; газетные и журнальные тексты). Тут же приведено и число разных текстов, в которых встречалось данное слово (ведь эта характеристика не менее важна, чем абсолютная частота, которая, как уже говорилось, может зависеть от специфики текста, сюжета и т. п.).
Вслед за алфавитно-частотным словарем идет частотный. Слова даны здесь в порядке убывания частот. На первом месте стоит предлог в. Вместе со своим вариантом предлогом во он встретился в текстах почти сорок три тысячи раз! На втором месте по частоте употребления идет союз и, он встретился более тридцати шести тысяч раз. Отрицание не — на третьем месте (около двадцати тысяч раз), на четвертом — предлог на (свыше семнадцати тысяч). Местоимение я занимает пятое место — оно встретилось в текстах около четырнадцати тысяч раз.
Верхнюю часть списка наиболее употребительных слов занимают предлоги, союзы, частицы, местоимения. Лишь в четвертом десятке этих слов появляется глагол мочь, числительное один, а на шестом десятке — существительное год и прилагательное большой. Зато потом эти части речи занимают львиную долю списка.
Текстообразовательная способность
Третья часть «Частотного словаря русского языка» посвящена статистическим данным. И статистика, приводимая в ней, нужна не только специалистам по математической лингвистике или теории вероятностей. Она имеет важное значение в практике, в отборе слов для изучения русского языка.
В текстах, объемом в миллион слов встретилось около сорока тысяч словоупотреблений. Но свыше тринадцати тысяч различных слов употреблены были всего лишь один раз, около шести тысяч — два раза. Ясно, что слова эти редкие, их нельзя включить в словари-минимумы. Столь же ясно, что слова, имеющие частоту в несколько тысяч, в эти словари должны быть включены обязательно. Легко провести черту между очень частыми и очень редкими словами. Но как провести ее между словами не очень частыми и скорее частыми, чем редкими? Сколько нужно слов для словаря-минимума?
Вопрос этот мы уже задавали в самом начале нашего рассказа. Теперь, когда вы узнали о частотных словарях, переформулируем его: какую часть слов из списка самых частых мы должны брать — сотню слов? тысячу? десять тысяч?
На помощь лингвистике вновь приходит статистика.
Обратимся к нашему «Частотному словарю русского языка». Первые десять слов (ничтожнейшая часть от общего числа различных слов) покрывают почти двадцать процентов всего текста. Первая сотня самых частых слов составляет лишь четверть процента словаря. Зато в тексте она покрывает свыше сорока процентов всех слов. Первая тысяча слов, два с половиной процента всех слов словаря, покрывает свыше шестидесяти семи процентов текста.
Около девяти тысяч слов встретилось в текстах десять и более раз. Слова эти составляют менее четверти всего словаря. Зато покрывают они более девяноста процентов текста. Остальные же тридцать тысяч слов не покрывают и восьми процентов всех текстов. Очевидно, заучивать эти тридцать тысяч слов нецелесообразно. Знание же слов с частотой «десять» и более позволит понимать практически весь текст.
Может быть, и в списке слов, имеющих частоты «десять» и выше, также можно сделать сокращения? Первая тысяча слов частотного словаря, будь то русский, испанский, английский, французский, немецкий или любой другой язык, покрывает значительную часть текста, Какую — зависит не только и не столько от конкретного языка, сколько от стиля, типа речи.
О языкознании написано много интересных научно-популярных книг. О грамматологии — ни одной. «Книга о букве» — первая попытка рассказать об увлекательных и разнообразных проблемах, которые решает наука о письме. Рассказ о грамматологии строится как серия очерков, в которых излагаются основные проблемы этой науки. При этом главное внимание уделено наиболее важным темам — происхождению письма, его ранним этапам, типам письменности, их соотношению, общему направлению развития письма, а также методам дешифровки.
В книге рассказывается история главного героя, который сталкивается с различными проблемами и препятствиями на протяжении всего своего путешествия. По пути он встречает множество второстепенных персонажей, которые играют важные роли в истории. Благодаря опыту главного героя книга исследует такие темы, как любовь, потеря, надежда и стойкость. По мере того, как главный герой преодолевает свои трудности, он усваивает ценные уроки жизни и растет как личность.
В 1972 году исполнится 150 лет со времени дешифровки французским ученым Франсуа Шампольоном египетских иероглифов, бывших главной загадкой древней культуры Египта.О титаническом труде Шампольона и других исследователей, о развитии египтологии, открывшей миру великую и древнюю цивилизацию планеты, о вкладе русских ученых в дешифровку иероглифов, о неразгаданных и по сей день египетских письменах рассказывается в этой книге.
Палиндром (в переводе с греческого — бегущий назад) — слово или стих, одинаково читаемый как слева направо, так и справа налево.Поэма Александра Кондратова продолжает традиции классического русского палиндрома.
В языках повсюду можно отыскать следы древнейшей истории и культурных контактов, первобытного мировоззрения и особенностей мышления данного народа. Конечно, в одной книге можно лишь приоткрыть дверь в увлекательный мир, который скрывается за такими, казалось бы, сухими и скучными страницами словарей и грамматик.В книге делается краткий обзор истории мировых языков, прослеживается связь между ними, взаимовлияния культур.
Когда-то Тихий океан открывали Кук, Лаперуз, Лисянский, Крузенштерн, Литке и другие. В наши дни идет новое открытие величайшего океана — открытие его дна, гигантской подводной страны, занимающей 1/3 поверхности нашей планеты. Исследование Тихого океана и его дна связано с решением вопроса, который вот уже около двухсот лет горячо обсуждается учеными всего мира: не существовала ли некогда в Тихом океане обширная страна (материк или группа архипелагов), ныне погруженная на дно? Гипотеза о затонувшей земле связана с целым рядом других гипотез: океанографических, археологических, лингвистических, зоологических, этнографических, геологических и т. д.Книга «Загадки Великого океана», рассчитанная на широкий круг читателей, продолжает цикл работ автора, посвященных загадкам океанов и затонувших земель.«Загадки Великого океана» — двадцать первая книга Александра Кондратова.
Человечеству в ХХ веке пришлось пережить многие войны, национальные конфликты и революции, сопровождавшиеся кровавыми расправами одних сторон над другими. Характер и масштаб их был разный, но в основе своей они нередко несли расовые противоречия.С тех пор научное сообщество в своем большинстве наложило гласные и негласные запреты не только на явно расистские учения, как, например, евгенику, но и на вполне научные области знания — среди них генетические, биологические, антропологические направления, связанные с развитием и особенностями человеческих рас.
Знать правду весьма полезно, особенно о своей жизни и своем здоровье. Это экономит силы, время и деньги, которых можно лишиться, гоняясь за химерами. Мифы о здоровье окружают нас везде, и их своевременное развенчание — залог полноценной жизни! В этой книге Андрей Сазонов собрал тридцать распространенных медицинских мифов, ложных утверждений, о который все не только слышали, но и успешно претворяли в жизнь. Какие продукты сжигают жиры, и есть ли смысл в перекусах? Вода обычная и минеральная — нужно ли нам выпивать 8 стаканов ежедневно? Седина от стресса и аллергия от тополиного пуха — где правда? Каждый развенчанный миф — шаг к осознанию того, как действительно нужно следить за своим здоровьем. Давайте жить качественно! Лечится тем, что помогает, покупать то, что нужно, делать то, что идет нам на пользу. Ударим по мифам научным подходом!
В русской истории 14 лет, прошедших с 1598 по 1612 год, называют «разрухою» или «Смутным временем». «Смятения» Русской земли, или «Московская трагедия», как писали о ней иностранцы, началась с прекращением династии Рюриковичей, т. е. после кончины Царя Фёдора Ивановича, и кончилась, когда земские чины, собравшиеся в Москве в начале 1613 г., избрали на престол в Цари Михаила Фёдоровича, родоначальника новой династии Дома Романовых.
Под именем лорда Кельвина вошел в историю британский ученый XIX века Уильям Томсон, один из создателей экспериментальной физики. Больше всего он запомнился своими работами по классической термодинамике, особенно касающимися введения в науку абсолютной температурной шкалы. Лорд Кельвин сделал вклад в развитие таких областей, как астрофизика, механика жидкостей и инженерное дело, он участвовал в прокладывании первого подводного телеграфного кабеля, связавшего Европу и Америку, а также в научных и философских дебатах об определении возраста Земли.
В сборник включены лучшие из тех произведений советских писателей-фантастов, которые впервые были опубликованы в издательстве «Знание». Это рассказы известных писателей, чей путь в научной фантастике начался в 50 — 60-е годы (Г. Альтова, Д. Биленкина, Е. Войскунского и И. Лукодьянова, Г. Гуревича, А. Днепрова, М. Емцева и Е. Парнова), а также произведения писателей младшего поколения (В. Колупаева, Г. Шаха и других). Книга рассчитана на широкий круг читателей.