Тезаурус (грекче thesaurus – кенч, казына) – бир тилдин семантикалык катыштарынын системасы берилген маани туюнтуучу бирдиктер тобу, б. а. тилдеги сөздөрдү жана алардын тексттеги колдонулуштарын толук камтыган сөздүк. Иш жүзүндө Тезаурус тилдин (улуттук тилдин же башкаруунун автоматтык системасы үчүн алынган формалдуу тилдин) семантикасын билдирет. Тезаурус адегенде бир тилдик сөздүк катары түзүлүп, андагы семантикалык карым-катыштагы сөздөрдү тематикалык жактан рубрикаларга топтоштурулат жана аны изилдөөгө өбөлгө түзөт. Информатикада тексттен маалыматтарды издеп, анын кыскача мазмунун туюнтуп берүүдө колдонулат. Мисалы, 1962-ж. чыккан англисче Тезаурус 240 миң сөздү бөлүштүргөн 10470 рубрикадан турат. 20-кылымдын 70-жылдары информация издегич Тезаурус тараган. Мындай Тезаурустарда атайын лексикалык бирдиктер – дескрипторлор бөлүнгөн. Алар боюнча документтик маалыматты автоматтык жол менен издесе болот. Мында Тезаурустун ар бир сөзү синонимдик дескриптор менен салыштырылып, алар үчүн ачык түрдө семантикалык карым-катыштар көрсөтүлөт. Тезаурустагы лексикалык бирдиктин (сөздүн, сөз тизмегинин) абалы анын тилдеги маанисин ачат. Тезаурус иш жүзүндө болмуш жөнүндөгү информация гана камтыбастан, метаинформацияны (информация жөнүндөгү) да өз кучагына алат.

Колдонулган адабияттар

түзөтүү