Мәдәни җомга

“TATZET” электрон тупланмасы

Гуманитар юнәлештәге төрле электрон проектлар тормышыбызга көннән-көн күбрәк үтеп керә. Алар Г.Ибраһимов исемендәге Тел, әдәбият һәм сәнгать институты, Гамәли семиотика институты һәм Татарстан Фәннәр академиясе белән хезмәттәшлек итә торган башка фәнни оешмалар катнашында эшләнә һәм кулланылышка кертелә. Әмма бу проектлар интернет челтәрендә төрле урынга чәчеп урнаштырыла. Шуңа да аларны табу...

Гуманитар юнәлештәге төрле электрон проектлар тормышыбызга көннән-көн күбрәк үтеп керә. Алар Г.Ибраһимов исемендәге Тел, әдәбият һәм сәнгать институты, Гамәли семиотика институты һәм Татарстан Фәннәр академиясе белән хезмәттәшлек итә торган башка фәнни оешмалар катнашында эшләнә һәм кулланылышка кертелә. Әмма бу проектлар интернет челтәрендә төрле урынга чәчеп урнаштырыла. Шуңа да аларны табу кыенлаша. Галимнәребез гуманитар юнәлештә фәнни эшчәнлек алып баруны җиңеләйтү, шушы максатта заманча инструментарийлар булдыру, тел, әдәбият, сәнгать белән бәйле материалларны интернет челтәре аша киң җәмәгатьчелеккә җиткерү, татар телен популярлаштыру, фәнни өйрәнү һәм тикшеренүләрне мәгълүмати тәэмин итү мөмкинлекләрен киңәйтү ниятеннән "Татар теле: зур электрон тупланма "TATZET" платформасын эшләгән.
"TATZET" татар теле сүзлекләренең электрон фондын; татар теленең электрон этнолингвистик терминологик сүзлеген; татар матур әдәбияты корпусын; "Туган тел" корпусын; татар халык сөйләшләре атласының электрон версиясен; Татарстан топонимнары каталогын; сөйләм технологияләре ярдәмендә башкарылган эшләнмәләр һәм сөйләм интерфейслы мобиль кушымталарны; тәрҗемәне автоматлаштыру өчен профессиональ SmartCat системасын; татар теленең морфологик анализаторын; Microsoft Office, Microsoft Windows, Android, iOS операцион системалары өчен татарча локализация пакетлары һәм Татарстан Республикасы Фәннәр академиясе тарафыннан эшләнгән башка проектларны бер урынга туплый.
Гомумән, "TATZET" Г. Ибраһимов исемендәге Тел, әдәбият һәм сәнгать институты, Гамәли семиотика институты һәм башка фәнни оешмалар тарафыннан төрле елларда эшләнгән 20 проектны үз эченә ала. Аларның кайберләре "2014-2020 елларда Татарстан Республикасы дәүләт телләрен һәм башка телләрне сак­лау, өйрәнү һәм үстерү" дәүләт программасы кысаларында эшләнгән. Әйтик, татар теле сүзлекләренең электрон фондын Тел, әдәбият һәм сәнгать институты галимнәре төрле елларда төзегән. Анда шулай ук республика нәшриятлары, аерым авторлар тәкъдим иткән белешмәлекләр дә бар. Филология фәннәре докторы Камил Галиуллин фонд белән таныштырганда искәртеп үткәнчә, платформада ике һәм күп телле, терминологик, аерым билгеләргә багышлап төзелгән, төрле аспектларны яктырткан һ.б. сүзлекләр урнаштырылган. Фондның чыганаклары сүз турында күп төрле мәгълүматны табу мөмкинлеген бирә. Әйтик, сүзнең дөрес язылышын, килеп чыгышын, басымын, тәрҗемәсен, грамматик үзенчәлекләрен, диалекталь сүзләрнең мәгънәсен, синонимнарын, фразеологизмнарда һәм сүз тезмәләрдә кулланылышын артык мәшәкатьсез генә тиз арада барлап алып була. Бу инде вакыт та бик күп тапкырлар экономияләнә, башкача әйтсәк, галимнәрнең фәнни эшләре дә тиз барачак, дигән сүз.
Татар теленең этнолингвистик терминологик сүзлеге аңа кертелгән терминнарның семантик тасвирланмаларын һәм татар диалектларындагы кулланылыш үрнәкләре тупланмасын үз эченә алган мәгълүмат базасыннан гыйбарәт. Тел, әдәбият һәм сәнгать институтының этнолингвистик экспедицияләре материалларына нигезләнеп төзелгән сүзлек татар халык сөйләшләре электрон атласының мәгълүмат базасы белән дә бәйләнгән.
Академия карамагындагы перспектив тикшеренүләр институтының оештыру-техник һәм фәнни тикшеренүләр аудиты бүлеге мөдире, филология фәннәре кандидаты Мансур Сәйхунов "Туган тел" корпусы турында сүз башлаганчы, "корпус" гыйбарәсенә аңлатма биреп узды. Ул - билгеле бер эзләү системасы белән җиһазландырылган зур сандагы текстлар җыелмасы. Бу тупланма телне мөмкин кадәр тулырак чагылдырырга тиеш. Галимме, студентмы, ул телдәге күренешләрне эзләр өчен корпуска керә ала. Корпуста фән, гуманитар, техник, матур әдәбият, публицистика текстлары да билгеле бер пропорциядә булырга тиеш. "Туган тел" корпусына хәзерге вакытта әдәби кулланылышта булган 150 миллионнан артык сүз тупланган. Шулай ук төрле стиль һәм жанрларга (матур әдәбият, матбугат язмалары, рәсми документлар, дәрес­лекләр, фәнни хезмәтләр һ. б.) карый торган текстлар кертелгән "Татар матур әдәбияты" корпусы да булдырылган. Анда татар әдипләренең әсәрләрен, фольклор жанрдагы текстларны, башка телләрдән татарчага тәрҗемә ителгән әдәбият үрнәкләрен күрергә мөмкин.
Корпус галимнәргә, фәнни хезмәт белән шөгыльләнүчеләргә мисаллар эзләүне җиңеләйтә. Аларга китап­ларда казынырга кирәк булмаячак. "Лемма" эзләү юлына, әйтик, "китап" сүзен кертәсең икән, бу сүзнең мөмкин булган барлык төрләнешләре һәм вариантлары килеп чыга. "Маска" дигәненә "кы" дип язган очракта, "кыр, кыз, кыл, кыздырма" кебек барлык сүзләр экранда була. Тамгалар аша да, сүзнең грамматик характерлары, заман, сан категорияләре буенча билгеле бер төркемен эзләп булачак. Ә инде "китап" дип язып, аның янәшәсенә "фигыль" тамгасы (v) куйсаң, сүзнең 1500 дән артык очрагы табыла, әдәби әсәрләрдән мисаллар китерелә.
"TATZET" платформасын тәкъдир итү барышында компьютер ярдәмендә текстларны тәрҗемә итү, язма материалны сөйләм формасына күчерү кебек мөмкинлекләр дә ачылуы турында да сөйләделәр. Татар сөйләме синтезаторы исә - персональ компьютерда язылган текстны тавыш белән әйтү мөмкинлеген тудыручы проект. Аны сукырлар һәм бик начар күрүчеләр аеруча шатланып кабул иткән.
Фәннәр академиясенең Гамәли семиотика институтында сөйләм технологияләре ярдәмендә башкарылган эшләнмәләр һәм сөйләм интерфейслы мобиль кушымталары комплексы тормышка ашырыла икән. Бүгенге көндә кешенең кайсы телдә сөйләвен билгеләү, татар сөйләмен тану һәм синтезлау программаларының гамәли версияләре эшләнгән. Ул татар телендәге сөйләм интерфейсын компьютерларга һәм мобиль җайланмаларга кертеп башкарыла. Татар теленең морфологик анализаторы ярдәмендә исә табигый телләрдәге текстлар автомат рәвештә анализлана. Ул секундына 5000 сүз анализларга сәләтле.
Гамәли семиотика институты директоры урынбасары Ринат Гыйльмуллин Microsoft Windows, Android, iOS операцион системалары өчен татарча локализация пакетлары, тәрҗемәне автоматлаштыру өчен профессиональ SmartCat системасы кебек проектлар белән дә таныштырды, SmartCatның гади кулланучыга да, профессиональ тәрҗемәчегә дә бик уңайлы итеп эшләнүе искәртелде. Системаның мөмкинлекләре зур. Текстларны төркем белән бергәләп тәрҗемә итүгә килгәндә, команда күбрәк эшләгән саен, тәрҗемәләр камилләшә барачак. Компьютердагы текстларны, кесә телефоннарындагы язмаларны татарчалаштыру, сүз хаталарын тикшерү дә мөмкин. Смартфоннар, Android, iOS кушымталары өчен дә сүзлекләрне эшләтеп булачак. Алар өчен клавиатуралар да булдырылган. Һәркем татарча текстлар, татарча СМСлар яза ала. Автоматик рәвештә тәрҗемә ителгән базадан система үзе тәкъдим эшли башлый. Моннан тыш, компьютерда аудио текстны язма рәвештә чыгару да хыял гына түгел икән инде.
Тел, әдәбият һәм сәнгать институты эшләгән топонимнар каталогына бүгенге көндә анда 3920 атама кертелгән. Тел, әдәбият һәм сәнгать институты директоры урынбасары Олег Хисамов каталогта Татарстанның барлык географик атамалары (ойконимнар, гидронимнар, оронимнар һәм микротопонимнарны) теркәләчәген әйтте. Алга таба барлык татар авыллары исемнәре буенча эшләргә ниятлиләр. Атамаларның килеп чыгышы, авылларның тарихы, хәтта тау-чишмәләр турында мәгъ­лүматлар булачак.
Әлбәттә, электрон сүзлекләр кулланылышка көннән-көн күбрәк керәчәк. Галимнәр шуңа да фонд нигезендә тупланмаларны тулыландыру һәм үстерү эшен дәвам итү белән бергә чыганаклар төркемнәрен киңәйтү, сүзләрнең фондта тасвирланган билгеләрен арттыру, интернеттагы башка электрон белешмәләр белән элемтә булдыру буенча эш алып барылачагын искәртә.
"TATZET" платформасы дәүләт органнарында эшләүчеләргә, галимнәргә, татар теле укытучыларына, студентларга, журналистларга аеруча файдалы. Татарстан Дәүләт Советының Мәгариф, мәдәният, фән, һәм милли мәсьәләләр комитеты рәисе Разил Вәлиев белдергәнчә, бүген республикада туган телне укыту мәсьәләсе кискенләшкән чорда, "TATZET" платформасы аеруча кирәкле. Г. Ибраһимов исемендәге Тел, әдәбият һәм сәнгать институты директоры Ким Миңнуллин платформада урын алган проектларның алга таба тагын да камилләштереләчәген, шуңа да фәнни җәмәгатьчелекнең, журналистларның, бүгенге көндә шәһәр-район хакимиятләрендә эшләүчеләрнең фикерләрен ишетү мөһим булуын әйтте. Сүзлекләрнең электрон фондына http://suzlek.antat.ru/ сылтамасы аша керергә мөмкин. "TATZET" платформасын тәкъдим итүдә шулай ук басма сүзлекләрнең бик кечкенә тиражлар белән нәшер ителүе, мәктәп китапханәләренә дә җитмәве турында фикерләр булды.
Сөембикә КАШАПОВА.

Нравится
Поделиться:
Реклама
Комментарии (0)
Осталось символов: