Sketch Engine platformasında Qırımtatar tili milliy korpusı (QTMK) ile çalışmağa başlamaq içün bağlantığa  basıñız.

QTMK qullanıcısına, korpus metinleriniñ bazasınen çalışmaq ve kerek talillerni elde etmek içün bir çoq alet mevcuttır. Bu bölükte, QTMKnıñ temel funktsiyaları, olar açqan imkânlar ve Sketch Engine platformasındaki çalışma talimatları aqqında malümat tapa bilesiñiz.

N-gramalar

N-gramalar — bu çoq sözlü ifadelerniñ sıqlıq cedveli ya da leksik taqımlarıdır. Bu funktsiya yardımınen, QTMK metinlerinde bulunğan kolokatsiyalarnı tedqiq etmek mümkün. N-grama cedvelini yapmaq bir-eki saniye tutar. Qoşma filtrlerniñ qullanılması, cedvel yapma ketişatını biraz yavaşlata bile.

Korpus qullanıcısı eki N-grama yapma mahanizmı arasında saylav yapa bile:

  • temel,
  • keniş.

Temel mehanizm tek bir parametrni, yani N-grama uzunlığını — kolokatsiyalardaki sözlerniñ sayısınıñ saylanmasına izin bere. Temel qıdıruv, ayrıca da az sıqlıqlı N-gramalarnı avtomatik olaraq çıqara (yani, Korpusta pek siyrek rastkelgenlerni).

Uzantılğan N-grama generatsiya mehanizmi daa büyük optsiya taqımını ögünden nazarğa ala. Böylece, N-grama uzunlığından ğayrı, cedvelniñ generatsiya yapacağı atributnı saylamaq mümkün, bunnen beraber söz ve lema (sözniñ başlanğıç şekli) eñ tarqalğandır. Netice, Korpus içindeki kolokatsiyalarnıñ minimum ve maksimum qullanuv sıqlığınen sıñırlana bile. N-gramanıñ içinde bir-de-bir yerde rastkelgen işaretlerge (ariflerge) köre filtr etmek içün «ile başlay», «ile bite» ve «içinde bulundura» kibi ilâve kriteriyler de mevcuttır.

Konkordans

Konkordans qıdıruvnıñ çeşit türlü parametrlerine saip eñ küçlü korpus aletidir. Bu funktsiya sözlerni, ibarelerni, teglerni, vesiqalarnı, metin türlerini ya da Korpus qurulışlarını tapmağa imkân bere ve neticelerni kontekstte konkordans şeklinde aks ete. Konkordansnı istenilgen neticeni elde etmek içün ayırımaq, filtrelemek, saymaq ve işlemek mümkün. Baqıp çıqma parametrleri lemalar (sözniñ başlanğıç şekli), tegler (sözlerniñ tasvir kodları) ve başqa atributlar kibi qoşma malümatlarnıñ aks etmege imkân bere.

Temel mehanizmni qullanıp, konkondrasnı yaratmaq içün bir söz ya da ibare yazmaq ve «Qıdıruv» dögmesine basmaq kerek. Daa sonra, baqıp çıqma parametrlerinden birini, yani neticelerniñ aks etüv rejimini sazlamaq mümkün:

  • KWIC — merkezde qıdıruv sözü ve solda ve sağda bir-de-bir kontekst ile konkordasnı çıqara.
  • Cümle — qıdırılğan sözni bulundırğan bütün cümlelerni köstere. Uzun cümleler kesilmey, bir qaç satırda kösterile.

Uzantılğan mehanizmni qullanıp konkordansnı yaratmaq içün qullanıcınıñ «Uzantılğan» qıstırğıçnı saylamaq, kerekli sazlamalarnı bermek ve «Keçmek» dögmesine basmaq kerek.

Aşağıdaki tabloda — konkordans ile çalışmanıñ mümkün olğan sazlamalar ve aletler bulunmaqta.

Timsal

İsim

Tarif

Netice malümatlar

Elde etilgen neticelernen bağlı qoşma malümatlar

Neticelerni filtrelemek 

Elde etilgen neticelerniñ filtreleme funktsiyası

Baqıp çıqma parametrni deñiştirmek 

Alınğan neticelerniñ aks etilmesini deñiştirme funktsiyası. «Satırlarnı nomeralamaq», «Sayıcını köstermek» ve başqa kibi funktsiyalarnı işletmek mümkün.

Yüklemek

QTMK konkordansında qıdıruv neticeleriniñ yüklenmesi funktsiyası. CSV, XLSX, XML ve başqa kibi fayllarnı yüklemek içün böyle formatlar uyğun.

Kriteriylerni deñiştirmek

Elde etilgen neticelernen bağlı kriteriylerni deñiştirmek (meselâ, qıdıruv soratmasında yapılğan deñişmeler)

Tesadufiy örnek almaq

Büyük konkordansnen çalışqanda, örnekniñ reprezentativligini saqlap, konkordans satırlarınıñ miqdarını azlaştırmaq içün tesadufiy örneklerni qullanalar.

Satırlarnı qarıştırmaq

Funktsiya, konkordans satırlarınıñ sırasını serbest bir şekilde deñiştire

Sınıflaştırma

Funktsiya, konkordans sartırlarını elifbe sırasına, KWICge köre ya da KWICnıñ solundan ya da sağından token ile sınflaştıra.

Sıqlıq

Funktsiya, çeşit sözlerniñ, lemalarnıñ (sözlerniñ başlanğıç şekli), teglerniñ (sözlerniñ morfologik tasvir kodları) ve konkodransta belgilengen mevamda tapılğan başqa atributlarnıñ cedvelini tertip ete ve er biriniñ sıqlığını esaplay.

Kolokatsiyalar

Funktsiya, KWICnıñ sağından ve/ya da solundan belgilengen diapazonnı skan ete ve kolokatsiyalarnıñ tanılması içün statistik hususiyetleriniñ saylavını esaplay.

Korpustaki işaretler bölügi

Diagrama, KWICniñ tapılğan korpusnıñ qısımlarını köstere.

KWIC / cümle

Neticelerni aks etüv rejimi:

  • KWIC konkordansnı merkezde qıdıruv sözü ve solda ve sağda nasıldır kontekstnen çıqara.
  • Qıdırılğan sözni bulundırğan bütün cümlelerni köstere. Uzun cümleler kesilmey, bir qaç satırda kösterile.

Yahşı luğat misalleri

Yahşı luğat misalleri — sözniñ eñ izalı qullanuv allardan örnekniñ Korpus materiallarına esaslanıp, generatsiya etmege imkân bergen ayrı konkordans aletidir.

Bu funktsiya, añlaşılması qolay ve luğat içün yahşı misaller (Good Dictionary EXamples) ya da  ögrenüv içün uyğun olğan cümleler olaraq hızmet etecek qadar olduqça izalı olğan cümlelerni avtomatik olaraq tanıy. GDEX aleti, izalı luğatlarnıñ, dersliklerniñ, başqa oquv materiallarnıñ tertipçileri içün faydalı olacaq.

Sözler cedveli

Bu funktsiya sayesinde Korpus qullanıcıları daqqalar içinde söz qullanuv sıqlıqlarınıñ ve başlanğıç şekilleriniñ cedvellerini tertip ete bilecek, tilde qaysı sözlerniñ daa sıq qullanılğanını tedqiqi ete bilecek, siyrek sözlerni tapıp olacaqlar ve daa ziyadesi.

Söz cedveli tokenler (leksemalar) seviyesinde çalışa. Toqtama parametrleri, sözler cedvelini tertip etecek, çünki söz olmağan metin birlemleri avtomatik olaraq çıqarılalar. Söz cedvelini, qullanuv sıqlığına köre minimum ve maksimum limit tayinlep de sıñırlandırmaq mümkün.

Qullanıcı söz cedveliniñ tertip etilmesi içün eki mehanizm arasında saylav yapa bile:

  • temel,
  • uzantılğann.

Anahtar sözler

Anahtar sözler – fokus korpusında temel (referent) korpusından daa sıq rastkelgen ayrı leksemalardır. Er bir leksema, fokus korpusında temel korpusından daa sıq qullanılsa anahtar söz yerine iddia ete bile. Neticede isimler ve sıfatlar üstün olacaq, çünki başqa söz çeşitleriniñ sıqlıqları adet üzre bütün metinlerde aynıdır.

Anahtar sözlerniñ çıqarma funktsiyası QTMK qullanıcılarına nevbetteki imkânlarnı bere:

  • korpusnıñ (qısımınıñ) unikal hususiyetleriniñ belgilenmesi

Bu funktsiya, qaysı sözler orta ya da atta yüksek sıqlıqta bütün tilden daa sıq qullanılğanını belli ete.

  • korpusnıñ qurulış elementleriniñ, ayrı metinlerniñ qıyaslanması

Eki metinni qolnen qıyaslamaq olduqça qıyın. Statistik qıyaslav, qısqa metinlerde bile, qol qıyaslamada farq etilmegen adiselerni meydanğa çıqara bile. Anahtar sözlerni eki korpusnı ya da alt korpuslarnı qıyaslamaq içün qullanmaq mümkün. Netice, referent (alt)korpusqa baqqanda fokus (alt)korpus içün neler has olğanını kösterir.

Bu alet, tafsilâtlı tedqiqat içün bir çoq parametrlernen çalışmağa imkân bere. Meselâ, siyrek ya da tarqalğan sözlerde diqqat toplamaq, belli leksemalarnı qıdıruv neticelerden çıqarmaq ve ilâhre.

Qullanıcı söz cedveliniñ tertip etilmesi içün eki mehanizm arasında saylav yapa bile:

  • temel,
  • uzantılğan.

Metin türleriniñ talili

Bu alet, meta malümatlarnı talil ete ve qullanıcılarğa QTMKnda yer alğan metinlernen bağlı statistikanı bere. Meselâ, er bir veb saytından yüklengen, er müellif tarafından yazılğan ya da er yıl yayınlanğan metinlerde korpus içindeki vesiqalarnıñ, tokenlernıñ ya da sözlerniñ sayısını köre bilesiñiz.

Metin türleriniñ talili boyunca videotalimat.