1.3 Қазақ тілінің лексикасы: корпустық саралау

Тiл бәрiн бiлдiре бiлуi керек, олай болмаса, сол тiлмен сөйлейтiн халық өзiнiң даму баспалдақтарының бәрiнен өте алмайды.

В. фон Гумбольдт

Байлық деп әдетте белгiлi бiр материалдық немесе рухани игiлiктiң жиынтығын айтамыз. Байлықтың критерийi игiлiктiң жеткіліктілігінен, сұранысты қанағаттандыратындығынан көрiнiс бередi. Қазақ жері пайдалы қазбаларға бай десек, ол бағалауымызды өзге елдердiң жерiнің пайдалы қазбаларымен салыстыра отырып дәлелдеу қиын емес. Сол сияқты, қазақ тiлiнiң байлығын да, егер солай екенi рас болса, өзге тiлдердiң байлығымен салыстырып көріп, көз жеткізуге әбден болады. Ол үшiн бұл жерде алдымен тiлдiң байлығын өлшейтiн өлшемдi және салыстыратын өзге тiлдi келiсiп таңдап алу керек.

Тiлдiң байлығының және өзге сипаттамаларының сол тiлде сөйлейтiн халықтың қоғамдық құрылысына, жайғасқан ареалына, істейтін кәсібіне, менталитетінің қалыптасуына тiкелей қатысы бар. «Халық қоғамдық прогрестің төменгi басқыштарының бiрiнде тұрса, оның тiлiнде жалпы және тектiк ұғымдар аз, арнаулы атаулар көп болады. Эскимос тiлiнде батысқа қарай жүзiп бара жатқан моржды «аргугах», солтүстiкке қарай жүзiп бара жатқан моржды «каврык», әр бағытқа жүзiп жүрген моржды «акылюграк», қоректенушi моржды «эхъык», ұйқыдағы моржды «кавалыграх» дейдi екен» [7: 145]. Егер эскимостардың кәсiптiк қызметiнің тар ауқымды жағдайындағы сөздерiне қарап отырсақ, өзге тiлдердiң ешқайсысында кездеспейтiн «байлықты» көрер едiк.

Х.-Г Гадамер былай дейдi: «Түйенi бұл жануардың шөл даланың тұрғындарына қатынасына қатысты алып айтқанда екi жүз түрлi сөздермен атайтын Африкалық тайпаның тiлi бар. Аталған қатынастарда сақталатын сөздiң басым мағынасына орай, түйе бiздiң алдымызда әрқашан басқа қырынан көрiнiп отырады» [8: 505]. Бұл құбылысты В.фон Гумбольдт былай түсiндiредi: «… сөз сезiммен қабылданатын нәрсенiң эквивалентi емес, сөз жасаудың нақты мезетiнде сөзтудырушы акт арқылы санада тұшынылғанның эквивалентi. Бiр нәрсенi көп сөздермен айтудың басты қайнары дәл осында; осылай, пiлдi бiресе екi рет су iшушi, бiресе қостiстi, ендi бiрде жалғызқолды деп, әр жағдайда бiр ғана нәрсенi айтатын санскритте, үш сөзбен үш түрлi ұғым берiледi» [9: 103].

Тiл қолдану практикасында ұшырасатын түрлi құбылыстардың сыртқы сипаттамаларына қарап, тіл байлығы туралы үстірт қорытынды шығара салуға болмайды. Абстрактi келiспен жоғарыда мысалдарда келтiрiлген эскимос немесе африкалық тайпа тiлдерiн дүние жүзiндегi «ең бай тiл» етiп сипаттауға тырысу ақылға сиымды бола алмайды. Сол сияқты қазақ тiлiнде малға, отбасына, ауыл тiршiлiгiне, тұрмыстық қатынастарға қатысты сөздердiң көптiгiн тiл байлығы ретiнде алға тарту діттеген нысанаға жеткізе алмайды. Бұл – тiлдiң байлығы мен тiлдiк практиканың арасындағы айырманы көре алмаушылықтан, тiлдi қоғамдық үдерiстен бөлiп қараудан, оның индустриялы қоғамға ену шарттылықтарын түсінбеуден туған қателiк болып шығар едi. «Тiлге (оның материалдық қабығына), бiрiншi жағынан, ойлаудың абстрактi мазмұнының қатысы, екiншi жағынан, қабылдау мен елестi сезiну, көрнекiлiк бейнесiнiң қатысы туралы мәселе де талқылауды және айырықша назар аударуды қажет етедi» [7: 119].

Г. Тардтың зерттеуiнше, «өткенге қаншалықты тереңiрек үңiлген сайын, бiз соншалықты адамзат тiлдерiнiң әртүрлiлiгi мен сандық көптiгiн ұшыратамыз және ол тiлдер, көпшілік жағдайда, өте бай болып шығады» [10: 280]. Алайда, «сауаты төмен адамдардың тiлiнiң, тура бақылағанда, көзге ұрып көрiнiп тұрған оралымдылығы мен тамсандырарлық оңтайлылығына» бас ұрудың қажеті жоқ. Әлеуметтiк тар ауқымдағы, шаруашылықтың шектеулi саласындағы тiлдiң бейнелілігі мен икемдiлiгiн идеалдауға болмайды. Оны Г. Тард былай түсiндiредi: «тiл идеялардың әлеуметтiк кеңiстiгi ретiнде көрiнiс бередi», «ақылдың негiзгi ұғымдары мен әлеуметтiк құрылыстың негiзгi установкалары ұқсас» [сонда: 130]. Мысалы, халық белгiлi бiр аумақта шаруашылықтың белгiлi бiр немесе бiрнеше түрiмен ғана айналысса, оның тiлi де сол аумақ пен шаруашылық түрлерiне сәйкес имманенттi кеңiстiк құрайды. Жоғарыда келтiрiлген эскимостар мен Батыс Африкалық тайпаның тiлдерi бiрiншi жағдайда солтүстiкте морж және балық аулау кәсібінде, екiншi жағдайда Африканың батысында мал шаруашылығы аясында байлық жасап отыр. Олардың байлығы «әлеуметтiк тар шеңбердегі қызмет тұрғысынан алып қарағанда… ақыл мен әлеуметтiк өмiр арасында болып жататын тағы басқа аналогиялардың» [сонда: 135] өндiрiмi болып табылады.

Шаруашылықтың бiрі екіншісіне ұқсас, шектеулі салаларында қолданылатын тiлдiң оралымды және икемдi болуы мен шаруашылықтың бiрі екіншісіне ұқсамайтын ондаған салаларында қолданылатын тiлдiң жетiлуiнiң салыстырмалы баяу жүруiнің осындай заңдылығы бар. Өйткенi, бірінші жағдайда тiл ресурстары шектеулi бағытқа жұмсалады және аграрлық салаларда дәлдiктен ауытқу мен бейнелiлiкке жол беру индустриялы қоғамдағыдай өндiрiске зиянын тигiзбейдi. Бұдан, бәрiбiр, тiлдiң әлеуметтiк шектеулi кеңiстiктегi оралымдылығы әлеуметтiк ауқымды кеңiстiктегi «қасаңдығымен» салыстырғанда артта қалу болып шығатынын аңғару қиын емес.

Қазақ тілінде жазылған лингвистикалық әдебиеттерде тiлдiң байлығын синонимнiң көптiгiмен өлшеу қажеттігін алға тарту көп ұшырасады. Бұл тұрғыға бажайлап қарау керек. Үстірт қарағанда, синонимнің көп болуы, кімге болса да, байлық болып көрінері хақ. Шынтуайттап келгенде, синонимнiң датқа колориттік мыс бере алатын, изосемиялық түрлерін ғана тiл байлығы деп тануға болады. Ал байлықтың жөні осы екен деп, бір семантикалық өрісте болса да, өзге мағынада қолданылып жүрген немесе қолдануға болатын сөздердiң, жеке мағыналық жүктеме алып жүре алатын согипонимдік қатынастардағы сөздердің, квазисинонимдердің есебiнен синонимдердi жасанды көбейтіп көрсетуге тырысу тiлдi қара жерге отырғызумен тең. Тiлдiң байлығын жарнамалау үшiн синонимдер қатарын жасанды көбейтуге тырысу тілдің репрезентативтік қабілетін әлсіретеді. Бұл бағыттағы әрекеттерді тiлге көрсетiлген «аюдың жанашырлығы» деп қана бағалауға болады. Көпшiлiкке түсiнiктi, қарапайым қисынға салғанда, тiл байлығы алдымен сол тiлде орнықты пiшiнде тұрып, жеке мағыналық жүктеме алып жүретін лексикалық бiрлiктердiң көптiгiмен өлшенедi.

* * *

Қазақ тiлiнiң жағдайына келетiн болсақ, оның аграрлық укладты қоғамда бай тiл болғаны белгілі. Кезінде аталған формацияның өмір шынайылығын көрсетуде, ауыл шаруашылығында, оның мал өсіретін саласында қолданылғанда еркін көсілгені рас. Алайда қазір қоғам өркениет сатысының аграрлықтан жоғарғы баспалдағына өтіп кетті. Осыған орай тілдің имманентті сипаттамаларына қатысты тұрғылар да өзгеруі тиіс еді. Бірақ қазақ тілтанушылары табандаған әдеттерінен табжылмады. «Қазақ тілі – өркениетті тілдердің бірде-біреуінен кем емес, сөз қоры 1 миллионға жуық мағыналық бірліктен («смысловые единицы») тұратын бай да, бейнелі тіл» деп өзеуреді Ә. Қайдаров [11: 25]. «Қазақ тiлiнде түйе ұғымының семантикалық өрiсiне енетiн 80 сөз бар» дегенді қайталаудан да жаңылмады тілші ғалымдар. Мұндай мысалдар қазақ тiлiнiң байлығының көрсеткiшi ретiнде барлық жерде және жиi алға тартылып жатты.

Шынайылығында, қазақ тілтанушылары ақсақалының тіл байлығы туралы бағасы аграрлы қоғам жағдайындағы тілдің байлығына қатысты алғанда ғана объективті бола алады. Индустриялы қоғам жағдайындағы қазақ тілінің ақиқатты суретін көз алдыға келтiру үшiн қазақ тiлінің лексикалық қорын есептеп, салыстырмалы анализ жасау қиын емес. «Осы кезге дейін ең көлемдi деген сөздiктерiмiзде жеке сөздердiң саны 67 мыңның шамасында болды» деп көрсеткен еді он бес томдық «Қазақ әдеби тiлiнiң сөздiгiнің» жауапты редакторларының бірі Н. Уәли [12: 7]. Бұл – ХХІ ғасырдың басына дейінгі кезеңде жинақталып келген көлем. Бұған қатысты ескере кететін бір нәрсе бар. Құрастырушылар қате атағандай, аталған туынды – әдеби тілдің сөздігі емес, жалпыхалықтық тілдің сөздігі болатын.

Расында да солай, аталған туындының әдеби тілдің сөздігі емес екенін Н. Уәли мырзаның өзі-ақ верификациялап беріп отыр. Көп жыл дайындалған, ұжымдық еңбектің  «Қазақ әдеби тілінің сөздігі» деп аталатынын ескермей, түсіндірме мақаласында ол былайша ағынан жарылады: «Сөздікте… көркем әдебиет тілінде жиірек кездесетін жергілікті сөздер мен кейбір көне сөздер біршама қамтылды». Ары қарай Сөздіктің жауапты редакторлары түсіндіруін былай жалғастырады: «көркем шығармаларда кездесетін қарапайым, тұрпайы т.б. бейәдеби элементтерге де Сөздікте азды-көпті орын берілді» [12: 11]. Демек, туынды «Қазақ әдеби тілінің сөздігі» деп аталады, ал оның маңыз аларлық көлемін бейәдеби лексика құрайды. Бұл ешқандай сындарлы логикамен қабыспайды.

Лингвистикадағы орталық ұғым болуына қарамастан, «әдеби лексика» және «бейәдеби лексика» категорияларының арасындағы шекара осы уақытқа дейін ажыратылмай келеді. Қазақ тілтанушылары «әдеби тіл» мен «көркем әдебиет тілін» де шатастырып қолданып жүр. Олардың түсінігінде «әдеби тіл» ұғымы төңкеріліп түсіп жатыр (ол туралы толығырақ зерттеулердің 1.5 тармағын қараңыз). Қазақ тілінің бар қырсығы осыдан – лингвистика атаулының орталық ұғымдарын бұрмалап түсінуден бастау алып отыр. Соңғы 25 жылдың ішінде қазақ тілтанушыларының стратегиялық қателері мемлекеттік тілді дамыту жолындағы басты тежегіш факторға айналып алған.

Тіл кеңістігінде қалыптасқан панораманы толық көз алдыға келтіру үшін тілдің лексикалық қорын қазақ лингвистикасы үшін тағы бір түрен түспеген тың болып табылатын корпустық лингвистика тұрғысынан бағалап қарау керек. Арада 4 жыл өткізіп, аталған сөздіктің 15-томындағы түсініктемесінде Н. Уәли мырза  «лексикографиялық саралаудың нәтижесінде 92300-ден астам атау сөздерден, 57800-ге жуық тұрақты тіркестен тұратын сөзтізбенің базалық корпусы жасалды» [13: 819] деген түзетілген мәліметін берді. Міне, жалпыхалықтық тіл лексикасы мейілінше мол қамтылған осы көлемге объективті сапалық сипаттама жасау арқылы қазіргі қазақ тілінің байлығы туралы сындарлы пікір айтуға болады.

Аталған сөздіктегі бейәдеби лексикаға қатысты сөз болғанда ескермеске болмайтын бір қатар түйткілдер бар. Сөздікте арготизмдер, неологизмдер, тағы басқа әдеби тіл корпусына кіре алмайтын бірліктердің маңыз аларлық орын алғаны өз алдына. Бұған қоса, корпустық саралау жүргізілмеген қазақ тілінің бейәдеби лексикасының көлемі мен құрамы тым ауқымды екенін назардан тыс қалдыруға болмайды. Бұл жерде сөз көп нұсқада айтылып жүрген сөздер, астарлы мағынада қолданылып тұрған сөздер, күрделі редупликациялық құрылымдар және инсультациялар жөнінде болып отыр. Әдебиліктен тыс лексикалық бірліктердің көптігі – әдеби нормалау үдерісінің жүргізілмегенінің салдары болып отыр.

Құрастырушылар қазақ тілінің сөздіктеріне стандарттау тезінен өтпегендіктен, жазылуы және айтылуы жағынан түрлі нұсқаларда қолданылып жүрген сөздердің бәрін енгізіп жіберген. Олардың бәрі жеке мағына алып жүретін лексикалық бірліктер ретінде, сөздіктен орын алған. Мысалы, өмір – ғұмыр; әлем – ғалам; адым – қадым – қадам; қақы – құқы – құқығы,..

Кейде бір ғана ұғымды білдіретін бір сөздің бұқара арасында 3, 5, 7 немесе оншақты пішінде айтылып жүрген, бейпіл нұсқаларының бәрі келтіріледі. Аталған «Қазақ әдеби тілінің сөздігінде» әлсіз адамның аяғын нық баса алмай, тәлтіректеп жүруі мағынасын беретін 36 «сөз» және «сөздер тіркесі» тіркелген.

Олар мыналар:

қалт-қалт, қалтақ, қалтақ-қалтақ, қалтақ-құлтақ, қалтақта, қалтақтат, қалтақтау, қалталақ, қалталақта, қалталақтау, қалтаңда, қалтаңдау, қалтаң, қалтаң қақты, қалтаң-қалтаң, қалтаң-қалтаң етті, қалтаң-құлтаң, қалтаң-құлтаң етті, қалтаңдату, қалт-қалт, қалт-қалт етті, қалт-құлт, қалт-құлт етті, қалтылда, қалтылдақ, қалтылдату, қалтылдау, қалтырақта, қалтырақтат, қалтырақтау, қалтырақтату, қалтырат, қалтырату, қалтыратыңқыра, қалтырау, қалтырауық [132].

Бұған қосымша, осы мағынада қолданылатын, өзге әріптерден басталатын сөздер де бар: тәлтіректеу, шатқаяқтау,..

Шынтуайттап келгенде, бұлар – бір семантикалық өрісте коннотациялық реверс жасауға қабілетті сөздер емес, синонимдерге де жатпайды. Бұларды тіл мәдениетінен хабарсыз адамдардың бейпіл қолданысынан туындаған, қарабайыр вилланолекттегі көпнұсқалылық деп бағалауға болады. Сөз орнықтылығына қойылатын талаппты түсінбейтін адамдар аузына бірінші түскен нұсқаны қолдана салады. Бұл тізім, сөздікті құрастырушылар ойлағандай, қазақ тілінің байлығының айғағы болып тұрған жоқ, керісінше, қазақ тілінде норма жоқ екендігінің дәлелі болып, тілдің беделін түсіріп, үйренушіні де қазақ тілінен үркітіп тұр.

Сөздікті құрастырушылар бұларды қазақ лексикасын көлем жағынан  көбейтіп көрсету үшін, шынайылығында ондай ниеттен ада емес болса да, саналы түрде алып отырған жоқ. Қолда бар лексикалық материалдың тапшылығы жағдайынан шығудың оңай жолы бұл емес. Бір ұғымды білдіретін, бірақ түрліше айтылатын сөздердің толып жатқан нұсқаларының бәрін жеке лексикалық мағына ретінде санға енгізіп жіберу – олардың тілдердің даму диалектикасын түсіне алмаудан, бұл жерде, «әдеби лексика» мен «бейәдеби лексика» арасындағы айырманы анықтап ала алмағандығынан туындап отыр.  Бірізді нормаға түспегендіктен, бейпіл жіберілген көпнұсқалы сөздердің бәрін тілдің лексикалық бірліктерінің абсолюттік көлемін көбейту үшін келтіру ғылымилыққа жатпайды. Түбінде нормаланған корпусқа енгізуге олардың біреуі ғана таңдалынып алынып, өзге нұсқалары қолданыстан шығарылып тасталады.

Қазақ тілінде күрделі редупликациялық құрылымдар (КРҚ) көп ұшырасады. Қазақ лингвистері оларды «қос сөздер» деп атайды. Олардың көпшілігінің тұлғалық және мағыналық орнықтылығы жоқ, грамматикасы да бұлдыр (КРҚ туралы толығырақ 2.1.6 тармақты қараңыз). Бейәдеби лексиканың үлкен шоғырын осы КРҚ деп аталатын топқа енетін лексикалық бірліктер құрайды.

Жалпыхалықтық тілдің құрамында пейоративті лексика, инсультациялар (лат. insultatio – насмешка, выпад), конфликтогендердің тағы басқа түрлері жиі ұшырасады: мақау, мылжың, миғұла, мәжін, есірік, топас, кебекбас, көрсоқыр, былжыр, бозөкпе,… Бұлар да әдеби тіл корпусына енбейді.

Бейнелі сөйлеуге тырысатын қазақ әдетінің салдарынан жалпыхалықтық тілде астарлы мағынадағы нұсқасы кең таралып кеткен сөздер көп. Мысалы, үш жастағы түйенің ұрғашысын білдіретін «бүлдіршін» сөзін «бала» мағынасында, «серке», «көшбасшы» сөздерін «жетекші» мағынасында қолдану кең таралған. Бұлардың узустық мағынада қолданылу құқығы бар. Ал дүниежүзілік лингвистика ғылымы астарлы мағынадағы сөздерді әдеби тіл корпусына қоспайды.

Бұл жерде келесі бір маңызды құбылысқа тоқталмай кетуге болмайды. Сөз қазақ тіліндегі арнайы атаулар жөнінде болып отыр. Мысалы, «түйе» семантикалық өрісінде інген, ілек, аруана, құнанша, дөненше, мая, нарша, көшек, атан, соқтан,.. деген атаулар бар. Бұл тізімді соза беруге болады, әрине. Бірақ оған мақтанатын дәнеңе жоқ. Мәселенің үлкені мынада: бұл сөздер, узустық мағынасында тұрғанының өзінде, индустриялы қоғамның әдеби тілі корпусына ене алмайды. Өйткені, ауыл лингвемасын табиғи қалпында индустриялы қоғамның тіліне аудара салуға болмайды. Индустриялы қоғамның тілінің ерекшелігі ол тілде жалпылама және тектік ұғымдар басымдыққа ие болатынында. Бұл лингвистиканың ғылым ретінде көпғасырлық дамуы барысында қалыптасқан, дамыған елдерде сөз қолдану практикасында ақталған үрдіс. Егер сөз қолданушыға «түйе» өрісіндегі атаулармен аталатын ұғымды жеткізу қажет болса, онда ол ойын тектік және жалпылама ұғымдармен оңай жеткізе алады. Мысалы, «χ-жастағы ұрғашы түйе», «y-жастағы түйенің еркегі».

Егер жалпыхалықтық тіл корпусынан жоғарыда аталған бейәдеби лексиканың бәрін алып тастап, нормалауға болатын сөздерді ғана қалдырсақ, ол 15 томдықтағы көлемнің мөлшермен ⅓-ін ғана құрайды. Бұл индустриялы қоғамның әдеби тілі үшін аздық етеді. Демек, мемлекеттік тілді дамытудың алғышқы кезеңінде 25-30 мың шамасындағы бірліктен тұратын, әдеби нормаланған базалық корпусты қалыптастыру керек және жалпыхалықтық тіл қорынан іріктеп ала отырып, қазақ тілінің эквивалентсіз қуысын толтыруға күш салу керек.

Салыстыру үшін орыс тiлiнiң лексикалық қоры толық емес, кең қолданылатын сөздiктерiнiң бiрiн алайық. Оған 120 мың сөз енген [14: 3]. Бұл – экономикалық айналысқа енгізілген, нормаланған көлем. Бұған ерікті тіркестер, мақалдар мен мәтелдер қосылмаған.

Зерттеуші М. Эпштейн мынадай мәліметтер келтіреді: «қазіргі орыс тілі 150 мың лексикалық бірліктен тұрады. Салыстыра қарасақ, В. Дальдің сөздігінде 200 мың сөз бар. Қазіргі неміс тілінің лексикалық қоры, түрлі есеппен, 185 мыңнан 300 мыңға дейін. Қазіргі ағылшын тілінде 750 мың сөз бар» [15: 193]. Ол тiлдермен салыстырғанда қазақ тiлiнiң күйi қандай? Бұл –  тіл байлығының қарапайым арифметикамен өрнектелген бір қыры ғана.

* * *

Сөз қолдану практикасында сыннан өткен, тілді корпустық саралау қағидалары және оларды қазіргі қазақ тілінің күйіне бейімдеп қолдану қазақ тілін меңгерудің 4 деңгейін алға тартады.

Тіл үйренудің бірінші деңгейі бейресми аяда қауышуға мүмкіндік беретін минимум-корпусты құрайды. Корпус-минимум мөлшермен 3000 сөзден тұрады. Бұл көлем «Жалпыеропалық ағылшын тілін меңгеру компетенттігі шкаласының» (The Common European Framework of Reference for Languages: Learning, Teaching, Assessment, CEFR или CEF) сөздік қоры 2750-3250 бірліктен тұратын «табалдырық аттау» (B1. Threshold or intermediate) [131] деңгейіне сәйкес келеді.

Бұл деңгейді игерген адам таныс тақырыптар бойынша (жұмыс, мектеп, демалыс т.б.) түскен ақпаратты қабылдайды. Саяхат кезінде ұшырасатын ахуалдардың көбінде түсінісе алады. Алған әсері, көрген оқиғалары туралы қысқаша баяндап, пікір білдіре алады. Түпнұсқадан көрген фильмді экрандағы бейнеден қосымша болжай отырып түсінеді. Қарапайым нұсқаулықты, жарнама брошюрасын, хаттарды, қысқа құжаттардың мазмұнын түсінеді, өзін қызықтырған тақырыпқа эссе, хат, хабар жаза алады.

Қазақ тілін меңгерудің екінші деңгейіне шыққан адам 7-8 мың (3000+5000) лексикалық бірлікті қолдануы керек. Оны меңгерген адам түрлі тақырыптардағы күрделі, ұзақ мәтіндердің мағынасын түсіне алады. Ойын толық жеткізе алады. Әлеуметтік-рухани аяларда тілді еркін қолданады. Көркем фильмді толық түсінеді. Күрделі тақырыптарға дұрыс құрылған сөйлемдермен, егжейлі түсінік беретін, байланысқан мәтін құрастырады

Ағылшын тілін C1 – Effective operational proficiency or advanced (сөздік қоры: 3750-4500 сөз) деңгейінде меңгерген адам іс жүзінде біз келтіріп отырған екінші деңгейдегі комптенттікті көрсете алады [131]. Бұл жерде индустриялы қоғамға  қызмет ететін, ағылшынның аналитикалық тілі мен аграрлы қоғам  аясында көрініп жүрген, агглютинативті қазақ тілінің ұқсас стандартты ахуалды сипаттауға жұмсайтын лексиксының көлемінің түрліше болатыны көрінеді. Бұдан қазақ тілін үйренудің ағылшын тілін үйренуге қарағанда қиынырақ екені көрінеді. Соған қарамастан, жоғарыда келтірілген көлемді балаларға мектеп қабырғасында меңгертіп жіберуге мүмкіндік мол. Келешекте ол көлем қазақ тілін әдеби нормаға келтіріп, жетілдірген сайын кеми беретін болады.

Қазақ тілін меңгерудің үшінші деңгейіне шыққан адам өзі қызмет ететін шаруашылық саласының ресми іс жүргізгенде қолданылатын арнайы лексикасын білуі керек. Оның мөлшері 9-10 мың (8000+2000) лексикалық бірліктен тұрады. Бұл көлем тіл үйренушіге өндірістік жиналыста сөйлеуге, баяндама дайындауға, есеп беруге, мәжілісхат жазуға тағы басқа ресми құжаттарды дайындауға мүмкіндік береді.

Жоғарғы мектепте тілді меңгерудің үшінші деңгейіне шыққан адамды тіл білетіндер санатына қосуға болады.

Корпустық саралау тұрғысынан тілді меңгерудің деңгейлік шарттылықтары

Кесте № 1

 Деңгейлер Деңгейлердің арнайылығы Лексикалық бірліктер мөлшері  Іс жүзінде қолданылу аясы

1

Бейресми аяда қолданылатын корпус-минимум

(B 1)

3000 сөз Адамның өзіне таныс тақырыптар (жұмыс, оқу, демалыс, саяхат т.б.) бойынша  түскен ақпараттарды түсінеді. Алған әсері, көрген оқиғалары туралы қысқаша баяндап, пікірін жеткізе алады. Көркем фильмді экрандағы бейнемен қабаттастыра болжап, түсінеді. Қарапайым нұсқаулықты, жарнаманың мазмұнын түсінеді, өзіне таныс тақырыпқа эссе, хат жазады, хабар бере алады.
2 Өмір аяларының бәрінде тілді белсенді қолдану

(С 1)

7-8 мың сөз Түрлі тақырыптардағы күрделі, ұзақ мәтіндердің мағынасын түсіне алады. Әлеуметтік-рухани аяларда тілді еркін қолданады, ойын жеткізе алады.. Көркем фильмді толық түсінеді. Күрделі тақырыптарға дұрыс құрылған сөйлемдермен, егжейлі түсінік беретін, байланысқан мәтін құрастырады
3 Шаруашылықтың белгілі саласында қолданылатын ар-найы лексика (С 2) 9-10 мың сөз Өндірістік жиналыста пікірін айтады, баяндама жасайды, жоспар құрады, есеп береді, мәжілісхат жазады, т.б. іскерлік құжаттар жүргізеді.
4  Заманауи зиялы адамның сөздік қоры мөлшері 11-12 мың сөз Өз ойлары мен идеяларын ауызша, жазбаша жеткізе алады, экономикалық, қоғамдық-гуманитарлық аяларда еркін ақпарат алмасады.

 

Қолданылу жиілігі ұстанымымен іріктеліп алынған тіл корпусының 4 деңгейі мектепте білім берудің тиесілі буындарында меңгеріледі адамдардың өмірлік қызметінде жалғастырылады:

1-деңгей 3000 сөз – бастауыш мектепте;

2-деңгей 7-8 мың сөз – орта мектепте;

3-деңгей 9-10 мың сөз – жоғары мектепте оқытылады.

4-деңгей 11-12 мың сөзді меңгеру адамның өмірлік қызмет барысында жалғасын табады.

Заманауи мәдениетті адамның сөздік қоры 11-12 мың лексикалық бірліктен түруы тиіс [3: 90]. Бұл мөлшер оның қоғам өмірінің барлық аяларында толық түсінісуін және ойын жеткізе алуын қамтамасыз етеді.

Корпустық саралау қағидалары бойынша сөздіктер лексикалық бірліктердің сөз қолданыста ұшырасу жиілігі ұстанымымен құрастырылады. Мемлекеттік тілді меңгеру корпустық саралау бойынша құрылған сөздіктер негізінде және келтірілген алгоритмді сақтай отырып жүзеге асырылады.

* * *

Байлықтың екінші қыры сападан көрініс береді. Қазақ тiлiнiң лексикалық қорына ареалды лингвистика тұрғысынан жасалған сараптаманың нәтижелері мынадай: қазiргi қазақ тiлiнiң лексикалық ресурсы ауыл шаруашылығын, соның iшiнде мал шаруашылығын, шаруа тұрмысын сипаттайтын сөздерге мол. Ал индустриялы қоғамның тiлiне қойылатын талаптар тұрғысынан қарағандағы ахуалы мәз емес. Индустриялы қоғам шынайылығын – өнеркәсiп, технология, қала тұрмысы, экономика, халықаралық саясат, әскер өмiрi аяларында болып жатқан құбылыстар мен үдерістерді толыққанды сипаттауға қолданылатын лексикасы толтыруды қажет етеді.

Мәселе бұл жерде автомобильдi құрайтын мыңдаған құрауыштың дөңгелек пен айнасынан басқасының қазақ тілінде эквиваленті жоқ лексика ретінде қалып отыруында емес. Өндiрiстi, технологияны былай қойғанда, қала адамдарының тұрмысын сипаттайтын этаж, подвал, балкон, веранда, лоджия, люк, перила, кухня, спальня, ванна, витраж, батарея, люстра, лампочка, ваза, включатель, розетка, плита, комфорка, диван, шкаф, полка,.. сияқты сөздердiң қазақшасына тапшылықты көрмей, «қазақ тілі өркениетті тілдердің бірде-біреуінен кем емес, сөздік қоры миллионнан асады» деп, көбік мәліметті көпірткеннен тілдің мәртебесі арта қоймайтынында. Жоғарыда аталғандағыдай, ондаған мың эквивалентсіз сөздердің қазақшасын тауып, орнына қою керектігінде.

Қазақ тiлiнiң байлығына берілген баға оны дүние жүзіндегі өз елiнде қолданылып жүрген ұлттық әдеби тiлдердiң байлығымен салыстыра бағалағанда ғана объективті болады.

* * *

Қазақ зиялыларының менталдық лексиконының көлемі қораш, таным кеңістігі тар. Ол бейресми аяда қолданылатын белсенді лексика мен жалпыхалықтық тілдің аграрлық укладтағы шаруа тұрмысын сипаттауда қолданылатын бөлігінен тұрады. Абсолюттік мөлшерде орташа танымал қазақ жазушысының сөздік қоры оншақты мың лексикалық бірлік шамасында болуы мүмкін. Бірақ оның менталитетке ықпал ететін бөлігі аграрлы сана кеңістігін ғана жабады. Бұған қоса, олардың онсыз да мардымсыз тіл ресурсын тек бейресми стильде ғана пайдаланатыны белгілі. Жұтаң лексикон және оның өзін тек бейресми стильде қолдану жазушының когнитивтік кеңістігін мейлінше тарылту факторына айналып, қазіргі ұлттық мәдениеттің, соның ішінде, қазақ әдебиетінің терең тығырығын шарттандырып тастаған.

* * *

Қазақ лингвистикасында фразеология туралы түсініктерде де бірізділік жоқ. Сөздіктерде қамтылған фразеологиялық бірліктерді (ФБ) көлем жағынан толық қамтылған деуге болмайды. Өйткені, тілдегі фразеологизмдердің саны жеке сөздерден ондаған есе артық болады. Бірнеше сөзден мағынасы басқа ондаған тіркес құрылуы мүмкін. Олардың бәрін толық қамтып шығару пайдалануға тиімді болмайды, салалар бойынша топтап шығару тиімді.

Л. Крысиннің фразеологизмге берген дефинициясы мынадай: «құрамға енгеннен кейін мағынасы өзгеріп кететін сөздердің орнықты тіркесі» [16]. Өзгелердің де түсінігі ұстанымында осыған саяды. Демек, «абсолюттік ноль» дегеніміз – ФБ-ге жатады.  Егер қазақ тілінің мысалдарына жүгінсек, «таяқ ұстап қалды» деген тіркестегі үш сөздің әр қайсысының алғашқы мағынасы әр түрлі. Ал үшеуі біріккенде тіркес «кедейленіп қалды» деген мағынаға ие болады.

Қай тілде болмасын, он цифрдан сан жетпес цифр түзуге болатыны сияқты, жекелеген сөздердің санынан оларды қолданып құраған ФБ-дің саны көп есе артық болады. Қазақ тілінде де солай. Мысалы, бір ғана «бас» сөзінің қатысуымен ондаған ФБ түзіледі: «қаны басына шапты», «басын тасқа ұрды», «бас еркі», «басқа-бас», «басқа түссе – баспақшыл», «бас басына би болған»,.. Осы тіркестерде ұшырасатын «қан», «тас», «ерік» сөздері де бастапқы ұғымынан басқа ондаған тіркестерді құруға қатысады.

Қазір өнеркәсіпте, технологияда түрлі операцияларды, командаларды, үдерістерді білдіретін, әлемнің қойнауларында болып жатқан құбылыстарды сипаттайтын күрделі тіркестерді санап шығудың қиындығы оларды қолданып сөйлеуден де қиынға айналып барады. Демек, тілдің қолда бар ондаған мыңдық сөздік қорынан қоғамдық өмірдің әлеуметтік-экономикалық және рухани аяларындағы (өндіріс, техника, технология жағын қоя тұрғанда) құбылыстар мен үдерістерді сипаттай алатын мыңдаған тіркестерді мағыналық және тұлғалық бірізділікке келтіріп, пайдалануға дайындап беру керек. Техникалық терминдерді аудармай-ақ қойғанның өзінде көпшілікке арналған ақпаратта жиі қолданылатын «наличные деньги», «интерактивный метод», «ключевое ведомство», «пороговые страны», «поимка с поличным», «пилотная программа», «зона Еровидения», «тестирование на предмет легитимности», «максимальная взлетная масса», «вызов времени», «определение самоидентификации», «пропускная способность транспортной развязки», «механизм издержек и противовесов», «презумпция невиновности», «оперативное реагирование», «протокольное мероприятие» деген сияқты мыңдаған құрылымдарды қазақ тілі жатық және жалпыға түсінікті жеткізе алуы керек. Онсыз тiлде даму болмайды. Өйткенi, В. фон. Гумбольдт  айтпақшы, «тiл бәрiн бiлдiре бiлуi керек, олай болмаса, сол тiлмен сөйлейтiн халық өзiнiң даму баспалдақтарының бәрiнен өте алмайды» [9: 171].

Индустриялы қоғам жағдайында іс жүргізуге қажетті сөзге тапшылық қазақ тілінің кемшілігінен емес, қазақ халқының ойының тұтқырлығынан да емес. Қазақ тілінің дағдарысы сәнді ғимаратқа отырғызып, заманауи жабдықтармен қамтамасыз етіп, атақ берген, ақы төлеген, тілді дамытуды мемлекет сеніп тапсырған ғалымдардың қолымен жасалып отыр. Қазақ тілінің байлығының ешбір өзге тілдердікінен кем емес екені де рас. Мәселе болған байлықты нормаға түсіріп, ұстап қала алмауда және оны тіл кеңістігіндегі эквивалентсіз қуысты жабуға тиімді пайдалана алмауда болып отыр.

Осы уақытқа дейін қазақ тілінің байлығы тыңғылықты жинақталмаған. Ж.Бабалықұлының келтіруі бойынша «отырықшы мәдениетті халық литвалықтар 4,5 млн сөз тіркеген көрінеді. Ал біз XX ғасырға отырықшы және көшпелі мәдениетті қатар алып кірген халықпыз. Көшпелі халықтың тіл байлығы отырықшылардікінен көбірек болады. Олай болса, қазақ тілінің сөздік қоры 10 млн-ның, соның ішінде түбір сөздің саны 1 млн-ның маңында болса керек» (Жағда Бабалықұлы. Сұхбат. Түркістан. 17.09.2009).

Әрине, тіл лексикасының басым көлемі отырықшылық және көшпелі мәдениеттерде бірдей қолданылатын сөздерден тұрады. Сондықтан, мәдениеттің екі тұрпатын қатар ұстанған халықтың сөздік қоры мәдениеттің бір тұрпатын ұстанатын халықтың сөзінен екі есе көп бола алмайды. Дегенмен, қазақ тілінің сөздік қоры тілді мемлекеттік мәрбесіне сай толыққанды қызмет ете алатын деңгейге көтеруге толық мүмкіндік әпере алатынына шүбә келтіруге болмайды. Осы болжамдарға сендіретін ілік те жоқ емес.

Өткен ғасырдың 50-70 жылдары қазақ тілінің этимологиялық сөздігін жасау жұмысы  жүргізілген. Г. Бельгердің еске алуы бойынша «1953 жылы қазақ тілінің алғашқы этимологиялық сөздігін басуға дайындап жатқанда Қазақ КСР Ғылым Академиясының қорында (картотекасында) 180 мың сөз болған. Ал 1972 жылы бұл картотекада 2 миллион 550 мың сөз жиналған. Қазақ сөзінің катотекасын құру 1937 жылдан басталған» [17: 114] екен. Сонан кейінгі кезеңде билік тарапынан бұл жұмысты ары қарай жалғастыруға тиым салынған.

Соңғы жылдары жүргізілген зерттеулердің қорытындылары бойынша таяу арада қазақ тілінің сөздік қорын (дәл ғылымдар, техника, технология жағына бармай-ақ қойғанда) 120000-ға, ал бір ұғымды білдіретін тіркестермен қоса есептегенде млн-ға жеткізу мүмкіндігі бар. Осы межені алғаннан кейін қазақ тілін мемлекеттік мәртебесіндегі қызметіне сай қолдануды пәрменді жүргізе бастауға болады.