© Татарский государственный гуманитарно-педагогический университет, 2007-2008.
Проект финансируется по Государственной программе Республики Татарстан по сохранению, изучению
и развитию государственных языков Республики Татарстан и других языков в Республике Татарстан на
2004 - 2013 годы
|
Sәxifә turında
Идея разместить в интернете интерактивный татарско-русский словарь не оригинальна. В интернете уже существуют татарские словари, больше напоминающие глоссарии, в которых слова размещены в статических html-страницах, например, на сайте
http://tugan-tel.noka.ru/, Болгар - рус - инглиз сyзлеге, Татарско-русский большой словарь и т.д.
Однако, во всех перечисленных словарях приводится небольшое количество значений, объясняющих слова, перечисленных через запятую. Хотя хотелось бы получить в интернете полноценную 4-уровневую словарную статью, показывающую
- омонимы слов,
- части речи, выражения или фразеологизмы,
- контексты использования,
- значения слов,
- примеры использования,
как это сделано во всех полноценных словарях, например, в англо-русском словаре Мюллера или в татарско-русском словаре под редакцией Ганиева.
Если размещать такие словарные статьи в html-страницах или pdf-файлах слов, то, либо количество таких слов будет небольшим, либо размер файла, который придется скачать, окажется немалым, что неудобно конечному пользователю, как, например, в http://www.tatar.ru/.
Таким образом, для конечного пользователя удобно выводить необходимую словарную статью по запросу к web-серверу, с базой данных слов и словарных статей. При этом web-сервер с базой данных должен:
- работать быстро,
- быть надёжным,
- иметь возможность содержать большое количество данных,
- обрабатывать одновременно выполняющиеся запросы,
- иметь возможность разрабатывать внутреннюю логику обработки данных.
Как показывает практика, базы данных, доступ к которым осуществляется на уровне операционной системы (dbf, MySQL и т.п.) не обладают вышеперечисленным набором качеств. Поэтому не увенчались успехом создане подобных on-line словарей, как, например, на сайте http://www.azatliq.org/.
Существует лишь немного доступных баз данных, обладающих всеми необходимыми свойствами на относительно недорогих серверах:
- MSSQL на IIS,
- Oracle на Oracle HTTP server.
Например, всемирно известный поисковик http://www.google.ru/, содержащий несколько миллиардов проиндексированных web-страниц, разработан на Oracle, а англо-русский словарь http://www.lingvo.ru/, содержащий несколько миллионов словарных статей, на MSSQL.
При разработке данного татарско-русского словаря использовался Oracle 9.2i, Oracle HTTP server, PL/SQL cartridge.
Все татарские слова в предлагаемом словаре расположены в строках таблицы. Поскольку в строки таблицы пока невозможно вставлять буквы алфавита Yanalif2 (кириллицу я не рассматриваю из-за множества причин, описанных в татнете), то пришлось использовать специально для этого разработанный алфавит Inalif2 на основе экспериментального алфавита Inalif.
Inalif2 отличается от Inalif пятью буквами, как это показано в разделе Алфавиты
Функциональность татарско-русского словаря
- Использование в качестве внутреннего алфавита Inalif2, трансформация его на любой из выбранных татарских алфавитов или переключении на русский для тех, кто не владеет татарским языком в достаточном объеме. Для вывода букв, не попавших в латинскую или кириллическую клавиатуру, используется Unicod, то есть нет необходимости иметь на своем компьютере определенный шрифт.
- Поиск слова по маске, например,
- можно выбрать слова, которые начинаются на ab по запросу ab*
- можно выбрать слова, содержащие ab по запросу *ab*
- можно выбрать слова, заканчивающиеся на ac по запросу *ac
Вообще, в качестве * может быть любое количество букв, в том числе ни одной. Если же необходимо найти слово из 3 букв, заканчивающихся на ac, то можно задать маску ?ac, то есть в качестве ? может быть только одна буква.
Такой поиск слова по маске иногда бывает удобен, если
- неизвестно как точно пишется необходимое слово, а известно лишь приблизительное написание
- неизвестна форма использования слова, например, падеж, часть речи и т.д.
- Поиск по некорректному написанию слов, например, в предлагаемом списке появится слово matbughat, если запросить слово matbugat. Вообще, поиск по некорректному написанию слов будет осуществляться при неправильно написанных буквах:
| a' → a |
|
o' → o |
|
u' → u |
|
n' → n |
|
q → k |
|
w → v |
|
zh → c |
|
h → x |
|
gh → g |
- Поиск в выбранном алфавите, используя буквы, находящиеся ниже поля ввода с подсказкой, как можно было бы набрать букву, используя Inalif2. Поиск на Inalif2, кроме того, используется во всех алфавитах. В русском варианте используется поиск в кириллическом алфавите.
- Вывод 4-уровневой словарной статьи, структура которой описана в начале.
- Вывод этимологии или происхождении слова, то есть с какого языка пришло слово в татарский язык.
- Агглютинативный разбор татарских слов на корень и аффиксы, вывод однокоренных слов или слов, начинающихся с такого же корня и такого же порядка аффиксов. Также есть возможность найти слова, начинающиеся на данный корень или корень с аффиксами. Это позволит понять структуру словообразования в татарском языке.
- Поиск русского слова или выражения и его переводы.
- Запоминание предыдущего состояния использования алфавита, а также запоминаются последние 20 запросов, сделанных пользователем на данном компьютере.
- Добавление слова + или группы слов ++, найденных по маске, в список, который потом можно будет распечатать на лист с двух сторон: Bastyryrgha, Bastyryrgha2 для того, чтобы можно было разрезать этот лист на маленькие "шпаргалки" и заучивать слова в свободное время.
- Озвучивание найденного слова, нажав на ♫
Планируется
- Вводить новые слова и пополнять значения из разных источников.
- Разложить все слова на корни и аффиксы.
- Озвучить все слова.
- Поместить фразеологический словарь.
- Разработать на основе данного словаря англо-татарский словарь.
- Разработать англо-татарский, татарско-английский переводчик предложений. Как результат можно получить русско-татарский и татарско русский переводчик предложений используя русско-английский переводчик http://www.translate.ru/.
- Помещать статьи, способствующие изучению, развитию татарского языка.
Общие цели проекта описаны в презентации
Использованная литература
- И.А. Абдуллин, Ф.А. Ганиев, М.Г. Мухамадиев, Р.А. Юналеева. Татарско-русский словарь: 25000 слов. Издание четвертое. Под редакцией Ф.А. Ганиева.– Казань: Татарское книжное издательство, 2004.– 488 стр.
- Ф.А. Ганиев, И.А. Абдуллин, Р.Г. Гатауллина, Ф.Ю. Юсупов. Татарско-русский учебный словарь. Около 10000 слов.– Казань: Раннур, 2000.– 416 стр.
- Х.Х. Сәлимов. Татар теленең орфографик-орфоэпик сүзлеге.– Казан: "Яңалиф" нәшрияты, 2004.– 192 бит
- Э.М Ахунзянов, Р.С. Газизов, Ф.А. Ганиев и др.. Русско-татарский словарь: Около 47 000 слов. Под редакцией Ф.А. Ганиева. 4-е издание, исправленное.– Москва: Инсан, 1997.– 720 с.
- Ф.С. Сафиуллина, К.С. Фатхулова. Татарский язык (интенсивный курс) издание второе, переработанное и дополненное.– Казань: ТаРИХ, 2001.– 448 с.
- Ф.С. Сафиуллина. Карманный татарско-русский и русско-татарский словарь.– Казань: Тарих, 2001.– 576 с.
- Ф.С. Сафиуллина. Татарский на каждый день. Самоучитель.– Казань: ТаРИХ, 2001.– 352 с.
- Л.Г. Габдрахманова. Русско-татарский разговорник.– Казань: ИПЦ "Экс-Пресс", 2003.– 80 с.
- Д.К. Галиева, Л.Н. Галиев. Учусь говорить по-татарски. Учебно-методическое пособие. 2-е издание, переработанное и дополненное.– Казань: ТАМГА, 2005.– 88 с.
- Ш.С. Ханбикова, Ф.С. Сафиуллина. Синонимнар сүзлеге.– Казан: Хәтер, 1999.– 256 б.
- Ф.С. Сафиуллина. Антонимнар сүзлеге.– Казан: Хәтер, 2005.– 235 б.
- Ф.С. Сафиуллина. Татарча-русча, русча-татарча антонимнар сүзлеге.– Казан: Хәтер, 2003.– 128 б.
- Ф.Ф. Гаффарова, Г.Г. Саберова. Татарча-русча идиомлар сүзлеге.– Казан: ИЯЛИ АН РТ, 2006.– 232 с.
О себе
Я, Кашаев Тимур, родился в г. Навои, Узбекистан. Там окончил школу и
поступил в МГУ им. Ломоносова на факультет ВМК (Вычислительной Математики и Кибернетики).
На третьем курсе был распределён на кафедру Математической Статистики к научному руководителю д.ф.-м.н., профессору Виктору Юрьевичу Королёву.
После окончания ВМК МГУ работал по специальности 2 года и затем поступил в аспирантуру на ту же
кафедру к тому же научному руководителю. В декабре 2003 года защитил кандидатскую диссертацию
на тему "Асимптотические аппроксимации для
распределений случайных сумм и некоторые их применения". Имеется 8 научных статей.
Во время учебы в аспирантуре играл в баскетбол в составе сборной МГУ.
Имею опыт по разработки информационных технологий, используя программные продукты фирмы
Oracle с 1997 года.
|