ШИ ЦЗИН. Расхождения в китайском тексте на разных сайтах. Ошибки и их исправление. |
До тех пор, пока я не поставил себе задачку подсчёта числа строф, строк, фраз и иероглифов в Ши цзин, я не задумывался о том, правильный китайский текст расположен на разных сайтах с текстом Ши цзин, или нет. Я взял за основу текст на одном из сайтов, который скачал к себе на компьютер. Там был китайский текст и перевод на английский Легга. Потом я обнаружил, что некоторые китайские иероглифы заменены ссылкой, по которой стоит указание, что этот иероглиф получается как совмещение двух других иероглифов. И я поискал в интернете китайский текст, где эти иероглифы присутствовали бы. Нашёл Chinese Text Project. Заодно я обнаружил некоторые расхождения моего сайта и Chinese Text Project в китайском тексте. Пытаясь понять, кто прав, а кто не прав, я поискал и нашёл ещё два сайта: В общем, оказалось, что текст правильный в Chinese Text Project, а остальные сайты, видимо, копируют одни и те же ошибки, восходящие к одному источнику. Исключение составляет разбивка на строки. Дело в том, что, как я понимаю, предложение заканчивается китайской точкой "。" и состоит из фраз, разделённых китайскими запятыми "、". Как правило, предложение совпадает со строкой. Однако в некоторых случаях в Chinese Text Project предложение изображается почему-то несколькими строками: последняя строка кончается точкой "。", а предыдущие – запятыми "、". И всё же в этих случаях я решил сделать так, как в Chinese Text Project. В файле, который хранится на моём компьютере, я исправил все расхождения. На чужих сайтах, естественно, этого не сделал. Вот список обнаруженных мною расхождений:
Кроме этого, я обнаружил три случая, когда в указанных выше сайтах разбиение на предложения и строки не совпадают: (1,2,3)=14.喓喓草蟲、趯趯阜螽 здесь нет знака препинания в конце строки, Кстати, третий случай (3,3,6) обнаружил не я, а моя программа вычисления таблиц: не совпали числа строк и предложений в стихотворении. Решил оставить так, как в Chinese Text Project. Кроме того, ещё на двух (китайских) сайтах я обнаружил другую разбивку на строки и даже предложения: некоторые точки заменены запятыми: https://zh.wikisource.org/zh-hant/%E8%A9%A9%E7%B6%93 Это наводит на мысль, что разбиение на строки (а возможно и предложения) не так уж важно. Кстати, я вот не знаю, а было ли такое разбиение в древности? По-видимому, главное – это разбиение на строфы и фразы. После всех этих исправлений файл с китайским текстом можно посмотреть: как плоский файл – TEXT_SHIJING.txt как html-файл – TEXT_SHIJING.html |