Пожалуйста, заводите новые беседы, если захотите отклониться от вопроса, поднятого в первом сообщении.

АвторСообщение



Сообщение N: 1
Учтён: 20.03.07
ссылка на сообщение  Отправлено: 20.03.07 00:54. Заголовок: Нахождение и выделение иностранных слов


Здравствуйте, на сайте Вы писали:

 выдержка:
Буду рад, если пришлёте БУКВОСОЧЕТАНИЯ, которые точно НЕ ВСТРЕЧАЮТСЯ в русском языке, но присутствуют в заимствованных словах ;-).


Нашёл у себя учебное пособие "Современный русский язык" (Д.Э. Розенталь, И.Б. Голуб, М.А. Теленкова; М., 1994). Отсканировал оттуда параграф "Фонетические и морфологические черты заимствованных слов" (см. рисунок ниже). Возможно, ничего нового для Вас там нет, а может, и найдёте что-то, что пригодится. Если хотите, могу отсканировать целиком главу (из которой и взят этот параграф) "Формирование русской лексики", там подробнее говорится о заимствованиях из разных языков, исконно русской лексике, способах заимствования итд.



Спасибо: 0 
УстановкиВыдержка Ответить
Ответов - 10 [только новые]


управляющий


Сообщение N: 100
Учтён: 24.07.06
ссылка на сообщение  Отправлено: 20.03.07 02:02. Заголовок: Re:


Егор, большое спасибо, пару новых черт для себя нашёл :-)
"Две гласных подряд"... Это мощно... особенно полезно тем, что количество правил сократится...
Посмотреть повнимательнее надо.
Вспомнилось... я от слов "перерыв", "прорыть" и т.п. всегда какое-то неудобство для произношения ощущал. А недавно нашёл: в славянских словах не могло быть две буквы "р". Например, немецкое слово "ярмарка" по этой причине сначала было заимствовано как "ярмонка". Сейчас это уже трудновато людям объяснять... Но, ещё несколько таких правил, и можно будет вводить "усиленную проверку на русскость" при выделении иностранных слов :-)

Насчёт "отсканировать целиком главу". Было бы здорово. Если будет время, скиньте на krina@gmail.ru

Кстати, раз Вы обратили внимание на это начинание, касающееся иностранных слов, не сочтёте за труд написать о своём впечатлении? В смысле "занятно, но неудобно", "бред полнейший", "хорошо, но слабовато" и так далее.
Просто отзывов действительно не хватает. К насмешкам я привык и очень их ценю - крайне полезная вещь в качестве руководства по улучшению. Так что, если напишете, - не стесняйтесь :-).
Месяц, как плотно занят на работе. Обновления "подвисли", но забраcывать не собираюсь :-)

Спасибо: 0 
УстановкиВыдержка Ответить



Сообщение N: 2
Учтён: 20.03.07
Откуда: Россия, Москва
ссылка на сообщение  Отправлено: 20.03.07 03:51. Заголовок: Re:



 выдержка:
"Две гласных подряд"... Это мощно... особенно полезно тем, что количество правил сократится...
Посмотреть повнимательнее надо.
Вспомнилось... я от слов "перерыв", "прорыть" и т.п. всегда какое-то неудобство для произношения ощущал.


С правилом №4 всё более-менее понятно, а вот, что касается №7 (сингармонизм), здесь сложнее, потому что программе нужно различать, когда гласные только одного ряда идут в корне, и слово является заимствованным из тюркских языков, от тех случаев, когда эти гласные появляются в результате словообразования (т.е. в приставках, суффиксах, окончаниях итд), что мы и видим в Ваших примерах (перерыв, прорыть). Кстати, [ы] относится к среднему ряду.


 выдержка:
Насчёт "отсканировать целиком главу". Было бы здорово. Если будет время, скиньте на krina@gmail.ru


Хорошо, только не сегодня, а то уже поздно.


 выдержка:
Кстати, раз Вы обратили внимание на это начинание, касающееся иностранных слов, не сочтёте за труд написать о своём впечатлении? В смысле "занятно, но неудобно", "бред полнейший", "хорошо, но слабовато" и так далее.
Просто отзывов действительно не хватает. К насмешкам я привык и очень их ценю - крайне полезная вещь в качестве руководства по улучшению. Так что, если напишете, - не стесняйтесь :-).
Месяц, как плотно занят на работе. Обновления "подвисли", но забраcывать не собираюсь :-)


Насмехаться я не собираюсь, хотя бы потому, что являюсь Вашим единомышленником по отношению к написанию точек над буквой "ё" и чрезмерному засорению русского языка заимствованными словами. Понятно, что не надо в приказном порядке отказываться от всех или почти всех заимствованных слов, тем более многие из них не имеют полных синонимов в русском языке или же настолько прочно и/или давно вошли в нашу речь, что могут и не восприниматься носителем языка как заимствованные; но, конечно, хотелось бы, чтобы в речи их было меньше, хотя бы в тех случаях, когда можно употребить слова со славянскими корнями без какой-либо потери (или искажения) смысла. Да и многим слушающим будет легче воспринимать такую речь, т.к. некоторые заимствованные слова могут оказаться незнакомыми. Что касается самой программы, то её главный недостаток пока (что Вы и сами, очевидно, знаете) - это ограниченный словарь. Я ради интереса взял словарь синонимов и стал вводить в МСВорд явно заимствованные слова на букву "Д" (как я понял, именно на эту букву Вы собираетесь расширить словарь для следующей версии) до тех пор, пока хватило терпения. Терпения хватило на 115 слов=), из них программа признала как заимствованные и предложила варианты замены для 29, т.е. 25%. Если надо, то могу Вам послать недостающие слова с синонимами. Тем не менее, программа вполне нормально выполняет свою основную функцию: позволяет человеку уменьшить в тексте количество заимствованных слов, если он этого хочет. Я прогнал один свой старый доклад через неё и примерно в половине случаев (навскидку) совершенно свободно можно было использовать один из предложенных синонимов для замены иноязычного слова без потери качества, стиля, смысла итд. текста. В остальных случаях что-то стало бы хромать в результате замены, но программа ведь не меняет автоматически, а позволяет пользователю выбрать. Что касается функции расставления точек над "ё", то мне было лень перечитывать весь текст и выявлять слова, которые были пропущены, на первый взгляд, всё было хорошо. Небольшой минус - слова "все" и "всё". Они встречаются довольно часто, и программа каждый раз спрашивает, надо ли менять в данном случае. Не знаю, можно ли сделать так, чтобы хотя бы в некоторых очевидных случаях она меняла/не меняла автоматически (например, перед существительным среднего рода менялось на "всё" (если между двумя словами нет знаков препинания), а перед существительным или прилагательным во множественном числе (опять же, если нет знаков препинания) оставалось слово "все"). В принципе, это небольшое неудобство некритично, так что можно оставить всё как есть. Если какие мысли ещё возникнут, напишу.

Спасибо: 0 
УстановкиВыдержка Ответить
управляющий


Сообщение N: 101
Учтён: 24.07.06
ссылка на сообщение  Отправлено: 20.03.07 11:04. Заголовок: Re:


Сингармонизмы я тоже с трудом воспринимаю, пока не прочувствовал. Это привыкнуть надо, чтобы отличать "налету".

Со сканированием: как получится, так и ладно :-)

Егор, насчёт насмешек я сказал просто для того, чтобы не боялись без обиняков сказать что думаете. Уже по тому, что Вы прислали первый скан было ясно, что Вы можете указать на недочёты, но не насмехаться, поскольку понимаете сложность задачи.

Насчёт слов на букву "д". Терпения у Вас хватает :-) Это довольно утомительно (правда, у меня шагов гораздо больше - всё это выверять надо на правильность изменения по числам, падежам, родам...)... Если не сложно, то пришлите отобранные Вами слова. Словарик пока мал, это да. Ну да это дело наживное... долгое только :-)

Насчёт "все" и "всё". Согласен, достаёт. Но, это не так просто.
Например хорошо бы сделать, чтобы "перед существительным среднего рода менялось на "всё" ". Но, как прописать такое правило, не знаю. Например, можно проверять следующее слово на то, что оно оканчивается на "о". Но, тогда можно нарваться на словосочетание вроде "...все недавно слушали эту передачу...". Приведённый пример коряв, но такие обороты не так редки... А определять часть речи приложение автоматически не может.
В прямой речи тоже встретиться может: "Всё песни бы ему петь, на завод бы лучше пошёл!". Тут "Всё" перед существительным множественного числа.

И так часто: нечасто встречающиеся обороты речи вынуждают ставить запросы на замену, хотя в подавляющем большинстве случаев они оказываются лишними. Словом, у меня просто не хватает образования, чтобы научить приложение разбираться в таких тонкостях. Если вдруг кто предложит, - будет здорово.


Спасибо: 0 
УстановкиВыдержка Ответить
управляющий


Сообщение N: 102
Учтён: 24.07.06
ссылка на сообщение  Отправлено: 20.03.07 15:15. Заголовок: Re:


Перечитал правила ещё раз.

Неясно упомянутое уже четрвёртое правило, свидетельствующее о нерусском происхождении слова, если в нём 2 гласных подряд.
Наверное здесь неполное правило приведено. Скорее всего, здесь речь идёт о двух гласных в корнях слов (или это верно без оговорок, но для древнерусского говора?). Иначе как быть со словами "перЕОдеться", "прЕОбразиться"... А жаль.

Пятое правило не до конца понятно.
Что может значить под "созвучия ке, хе, ге, подвергшиеся фонетическим изменениям в исконных словах..."?
Следует ли это понимать так, что когда-то такие сочетания были в русском языке, но потом произношение изменилось и теперь такие сочетания есть только в более поздних заимствованиях?

Спасибо: 0 
УстановкиВыдержка Ответить



Сообщение N: 3
Учтён: 20.03.07
Откуда: Россия, Москва
ссылка на сообщение  Отправлено: 20.03.07 18:05. Заголовок: Re:


Николай пишет:

 выдержка:
Наверное здесь неполное правило приведено. Скорее всего, здесь речь идёт о двух гласных в корнях слов (или это верно без оговорок, но для древнерусского говора?). Иначе как быть со словами "перЕОдеться", "прЕОбразиться"... А жаль.


Да, речь идёт о корнях, не знаю, можно ли как-то сделать, чтобы программа это отличала.
Николай пишет:

 выдержка:
Следует ли это понимать так, что когда-то такие сочетания были в русском языке, но потом произношение изменилось и теперь такие сочетания есть только в более поздних заимствованиях?


Я понял именно так. Сейчас взял словарь синонимов (просто он под рукой, рядом с компом лежит), посмотрел слова на "ге": гегемон, гегемония, геенна, гекатомба, гелертер, гелертеркий, гелертерство, геликоптер, геморрой, генеалогия, генезис, генеральный, генерация, гениальный, гений, гениталии, гербарий, геркулес, германец, герметически, герой (и производные от него), герольд, гетера, гетерогенность, гешефт. Как видите, ни одного слова со славянскими корнями нет, все на 100% заимствованные.

Некоторые мысли и замечания, которые пришли в голову:
1. Слово "анекдот" в некоторых падежных формах даёт 4 или 5 нормальных синонимов, а в некоторых только один, причём странный: "кусок прикола".
2. Не помешала бы кнопка "назад", т.е. если случайно поменял слово, которое не хотел или наоборот пропустил, которое хотел поменять, можно бы вернуться к нему).
3. Расширить словарь можно было бы способом, чтобы программа реагировоала на иностранный корень. Например, она выделяет слова и предлагает синонимы для слов: деспот, деспотично, деспотичный. Но никак не реагирует на: деспотизм, деспотически, деспотический, деспотичность и другие однокоренные слова. Было бы неплохо, если бы, наткнувшись на слово "деспотизм", она показывала, что в словаре есть 3 однокоренных слова с такими-то синонимами, и пользователь тогда сам сможет напечатать в окошке синоним.

Сканировать целиком главу не пришлось, как я и предполагал, всё уже сделано до нас))
http://www.durov.com/content/1119221968-119.html
Можно скачать книгу целиком в удобном формате .chm
По закону подлости в этом файле не хватает 2 параграфов и они именно из той главы, которая представляет наибольший для Вас интерес. Это параграфы 30 (который я выложил в первом сообщении) и 29, который удобно занимает ровно один разворот и я его сейчас отсканирую.

Спасибо: 0 
УстановкиВыдержка Ответить



Сообщение N: 4
Учтён: 20.03.07
Откуда: Россия, Москва
ссылка на сообщение  Отправлено: 20.03.07 18:27. Заголовок: Re:


Вот пар. 29

Кстати, по поводу ге, ке, хе. Здесь та же проблема. Если корень оканчивается, скажем, на "г", а за ним идёт суффикс "ен", то это не значит, конечно, что слово заимствованное, все фонетические правила действуют для корней слов.

Спасибо: 0 
УстановкиВыдержка Ответить
управляющий


Сообщение N: 104
Учтён: 24.07.06
ссылка на сообщение  Отправлено: 20.03.07 18:59. Заголовок: Re:


"[гкх]е" в начале слов - посмотреть уже орфогр. словарь надо сегодня...

>1. Слово "анекдот" в некоторых падежных формах даёт 4 или 5 нормальных синонима,

какие именно? Я у себя вижу, что это слово из расширенного списка, для которго есть только одна спорная замена:

>а в некоторых только один, причём странный: "кусок прикола".

просто когда не удалось подобрать достойные замены, иногда прописываю разговорные выражения. Не то чтобы я их проталкиваю, просто иногда кроме этого нет ничего и заменой являются самые неожиданные слова, хотя и в редких случаях... но, стараюсь этим не увлекаться.

>2. Не помешала бы кнопка "назад"

Да, надо бы... Но, это уже удобства, на которые я ПОКА не настроился - времени на словарь не хватает, а без него удобства малополезны...

>3. Расширить словарь можно было бы способом, чтобы программа реагировоала на иностранный корень. Например, она выделяет слова и предлагает синонимы для слов: деспот, деспотично, деспотичный. Но никак не реагирует на: деспотизм, деспотически, деспотический, деспотичность и другие однокоренные слова.

Сейчас готовлю список на букву "д" - там будут указанные слова. Просто я не знаю иного способа, чем прописывать слова впрямую( дальнейшее спряжение по числам, родам и прочему делает робот).
Можно сделать робота и для словообразования - брать корень и цеплять к нему приставки и суффиксы, но он будет составлять слова, которые не противоречать словообразованию, но в языке не употребляются. В итоге скорость упадёт в разы, если не на порядок.

>Было бы неплохо, если бы, наткнувшись на слово "деспотизм", она показывала, что в словаре есть 3 однокоренных слова с такими-то синонимами, и пользователь тогда сам сможет напечатать в окошке синоним.

Вот это любопытно, обдумать надо... Спасибо.
Действительно, не все замены можно учесть в описании одного слова, хотя я и стараюсь это исправно делать.

Насчёт книги: вот, ведь, нескладуха... впору поразмышлять о заговоре и ползучей контре :-)


Спасибо: 0 
УстановкиВыдержка Ответить
управляющий


Сообщение N: 105
Учтён: 24.07.06
ссылка на сообщение  Отправлено: 20.03.07 19:00. Заголовок: Re:


О, Егор, спасибо за скан!

Спасибо: 0 
УстановкиВыдержка Ответить



Сообщение N: 8
Учтён: 20.03.07
Откуда: Россия, Москва
ссылка на сообщение  Отправлено: 20.03.07 23:14. Заголовок: Re:



 выдержка:
какие именно?


Странно, сейчас написал слово "анекдот" во всех падежах, везде предложены были все синонимы... какая-то ошибка в прошлый раз произошла, наверное. Против слова "прикол" ничего не имею, просто словосочетания "кусок прикола" ни разу не слышал, но сейчас программа и не предлагает его...


Спасибо: 0 
УстановкиВыдержка Ответить
управляющий


Сообщение N: 109
Учтён: 24.07.06
ссылка на сообщение  Отправлено: 20.03.07 23:52. Заголовок: Re:


Кусок прикола всё-таки убрал :-) Нашёл небольшой сдвиг в словаре... там на самом деле несколько строк из ранних выпусков осталось... и в них анекдот был только с "куском прикола" и эта строчка шла до строки с более правильными заменами. Исправил.

Насчёт того, что: то выдавалось, а то нет. Вы просто в первый раз включили галочку "спорные замены" и не сохранили настройки. "Кусок прикола" появляется только при включённой этой настройке - подцепляются слова, для которых есть только спорные замены.

Спасибо: 0 
УстановкиВыдержка Ответить
Ответ:
1 2 3 4 5 6 7 8 9
большой шрифт малый шрифт надстрочный подстрочный заголовок большой заголовок видео с youtube.com картинка из Сети картинка с компьютера ссылка файл с компьютера русская клавиатура транслитератор  выдержка  кавычки моноширинный шрифт моноширинный шрифт горизонтальная линия отступ точка LI бегущая строка оффтопик свёрнутый текст

показывать это сообщение только смотрителям беседки
не делать ссылки живыми
Имя, пропуск:      учесть    
Тему читают:
- участник сейчас здесь
- участник отсутствует
Все даты в формате GMT  3 час. Просмотров сегодня: 1
Права: улыбки да, картинки да, шрифты да, голосования нет
аватары да, автозамена ссылок вкл, премодерация откл, правка нет