Skip to content Skip to navigation

Инфолекс

„Инфолекс“ – информационен лингвистичен портал за целите на българската лексикология, фразеология и лексикография*

Диана Благоева, Сия Колковска

(Институт за български език, Българска академия на науките)

Резюме

Описват се основните функционалности на отделните онлайн ресурси, включени в информационния лингвистичен портал „Инфолекс“, които са: Библиографска информационна система и Лексикални бази от данни за българския език (Лексикална база от данни със синонимни редове, Лексикална база от данни с антонимни групи, Неологичен речник, Регистър на фразеологизмите). Тези ресурси са предназначени за подпомагане на научните изследвания и обучението в посочените езиковедски области и дават възможност за лесно и удобно извършване на справки и извличане на библиографска и лингвистична информация.

Abstract

The paper describes the main functionalities of online resources that are part of the informational linguistic portal “Infolex”. These resources include Bibliographic informational system and Lexical database for the Bulgarian Language (the latter including Database with synonyms, Database with antonyms, Dictionary of New words, Register of phraseological units). These resources are intended to support scientific research and education in the linguistic fields mentioned, and to provide a possibility for an easy and convenient attainment of bibliographic and linguistic information.

Въведение

Статията има за цел да представи новосъздадени онлайн ресурси, насочени към подпомагане на научните изследвания и обучението в областта на българската лексикология, фразеология и лексикография. Тези ресурси са разработени от сътрудници на Института за български език „Проф. Любомир Андрейчин“ (основно членове на Секцията за българска лексикология и лексикография) в рамките на финансирания от Националния фонд „Научни изследвания“ към МОМН научноизследователски проект „Комплексно изследване на българската лексика и фразеология като част от културното наследство и националната идентичност“ с ръководител проф. д.ф.н. Лилия Крумова-Цветкова. Представяните ресурси са обединени в информационен лингвистичен портал „Инфолекс“, създаден от компютърни специалисти от технологичната компания BUL SI – Bulgarian System Integration (http://bul-si.bg/).

На сегашния етап порталът „Инфолекс“ предоставя достъп до:

  1. Библиографска информационна система
  2. Лексикални бази от данни за българския език

    1. Лексикална база от данни със синонимни редове
    2. Лексикална база от данни с антонимни групи
    3. Неологичен речник
    4. Регистър на фразеологизмите

Ще направим кратко описание на основните функционалности на всеки един от тези ресурси.

1. Библиографска информационна система

Тази информационна система включва пълни библиографски данни за публикувани през последните шест десетилетия изследвания в областта на българската лексикология, фразеология и лексикография: общо около 6000 библиографски записа за трудове от периода 1950–2011 г. Източници на данните са български и чуждестранни периодични издания, езиковедски сборници и поредици, електронни библиографски бази данни и каталози и др.

Отразени са сведения за над 200 монографии, 29 сборника, 32 учебника и помагала, 1968 статии и студии в сборници, 3007 статии в периодични издания, 186 дисертации, 202 рецензии за научни трудове, 261 рецензии за речници и пр., създадени от 1570 автори от България и други страни (като Русия, Украйна, Белорусия, Полша, Чехия, Словакия, Сърбия, Германия, Унгария, Норвегия, САЩ, Румъния, Франция, Турция, Китай, Виетнам). Описани са публикации на следните езици: български, руски, украински, белоруски, полски, чешки, словашки, сръбски, румънски, немски, френски, английски, италиански, испански, португалски.

За улеснение на потребителя всеки библиографски запис е снабден с допълнителна информация:

  • Определя се типът на публикацията (напр. монография, учебник, статия, глава в монография, рецензия и пр.).

  • Привеждат се ключови думи (подбрани от списък с около 250 ключови думи), които насочват към съдържанието на съответния труд.

  • При наличие на препечатки или преводи на изследването в специално поле се посочват библиографски данни за тях, а ако е установена и онлайн публикация, се дава нейният URL адрес (вж. Фигура 1 по-долу).

  • Отразяват се също така данни за отпечатани рецензии на съответния труд (вж. Фигура 2), като всяка рецензия присъства и като отделен библиографски запис в системата.

Библиографски запис с допълнителна информация за други печатни публикации и онлайн публикация на произведението

Фигура 1. Библиографски запис с допълнителна информация за други печатни публикации и онлайн публикация на произведението

Библиографски запис с допълнителна информация за отпечатани рецензии на произведението

Фигура 2. Библиографски запис с допълнителна информация за отпечатани рецензии на произведението

Библиографската информационна система дава възможност за провеждане на просто и разширено търсене. В първия случай се търси по дума или низ от символи в заглавието на труда или по фамилия на автора/редактора (вж. Фигура 3).

Фигура 3. Просто търсене по фамилия на автора/редактора

Фигура 3. Просто търсене по фамилия на автора/редактора

При разширеното търсене е възможна комбинация от различни критерии: фамилия на автора/редактора (възможен е избор от зададен списък), заглавие на труда, година на издаването, ключови думи и пр. (вж. Фигура 4).

Фигура 4. Разширено търсене с комбинация от критериите „фамилия на автор“ и „ключови думи“

Фигура 4. Разширено търсене с комбинация от критериите „фамилия на автор“ и „ключови думи“

Много полезна е също така предвидената възможност за извеждане на всички публикации, характеризирани чрез съответна ключова дума (с избор от зададен списък с ключови думи) (вж. Фигура 5).

Фигура 5. Търсене по ключова дума „немски заемки“

Фигура 5. Търсене по ключова дума „немски заемки“

В Библиографската информационна система са обхванати публикации, свързани не само с традиционни, но и със съвременни направления и проблеми в областта на българската лексикология, фразеология и лексикография като например компютърна лексикография, електронни речници, електронни лексикографски ресурси и др.

Стремежът към изчерпателност при ексцерпирането на библиографските записи от различните източници, детайлността на привежданата информация и удобният и достъпен интерфейс за търсене правят представената библиографска система изключително полезен източник за справки и съставяне на библиографии по различни теми в съответните езиковедски области. Системата е първи по рода си ресурс в българското интернет пространство, който спестява много време и усилия на лингвистите, работещи в областта на българската и славянската лексикология, фразеология и лексикография.

2. Лексикални бази от данни за българския език

2.1. Лексикална база от данни със синонимни редове

Синонимната база от данни представя сравнително пълно синонимното богатство на съвременния български език въз основа на данни от многотомния академичен Речник на българския език (1977–2012) и неговите лексикални архиви (http://www.ibl.bas.bg/projects_bg2.htm), както и на други лексикографски източници (Пернишка 2003).

Базата от данни съдържа около 27 000 уникални думи от четири части на речта, разпределени в синонимни редове, както следва:

  • глаголи – 2137 синонимни реда с общ брой думи – над 10 000;
  • съществителни имена – 3240 синонимни реда с общ брой думи – над 12 000;
  • прилагателни имена – 2496 синонимни реда с общ брой думи – над 10 000;
  • наречия – 910 синонимни реда с общ брой думи – над 3800.

При търсене в базата от данни всички синонимни редове, в които участва търсената дума, се извеждат един под друг с нарастваща номерация. За разграничаване на отделните значения на многозначна дума, която участва в повече от един синонимен ред, при необходимост се използват кратки пояснения, граматични или стилистични бележки, които се посочват в кръгли скоби след думата (вж. Фигура 6). За разграничаване на омоними се използват горни индекси (вж. Фигура 7).

Фигура 6. Синонимни редове, в които участва глаголът минавам

Фигура 6. Синонимни редове, в които участва глаголът минавам

Фигура 7. Синонимни редове, в които влизат съответно омонимите настъпвам1, настъпвам2, настъпвам3

Фигура 7. Синонимни редове, в които влизат съответно омонимите настъпвам1, настъпвам2, настъпвам3

2.2. Лексикална база от данни с антонимни групи

Базата от данни с антоними представя антонимното богатство на съвременния български език въз основа на данни от многотомния академичен Речник на българския език (1977–2012) и други лексикографски източници (Пернишка, Василева 1997). Тя съдържа около 8500 уникални думи от четири части на речта, разпределени в антонимни групи, както следва:

  • глаголи – 571 антонимни групи с общ брой думи – над 3000;
  • съществителни имена – 1399 антонимни групи с общ брой думи – над 5600;
  • прилагателни имена – 1092 антонимни групи с общ брой думи – над 4100;
  • наречия – 582 антонимни групи с общ брой думи – над 2100.

При търсене в базата от данни антонимните групи, в които участва търсената дума в различните си значения, се извеждат един под друг с нарастваща номерация. За граматична или стилистична характеристика на думите в антонимните групи при необходимост се използват граматични или стилистични бележки, помествани в кръгли скоби след съответната дума (вж. Фигура 8).

Фигура 8. Антонимни групи, в които влиза прилагателното име умен

Фигура 8. Антонимни групи, в които влиза прилагателното име умен

2.3. Неологичен речник

Обхваща над 2200 нови думи и 160 съставни названия и терминологични съчетания, навлезли в българския език през последните 20 години. Включени са и единици, които не са отразени в съществуващите печатни неологични речници (Пернишка и др. 2001; Пернишка и др. 2010).

Към всяка заглавна единица се привежда информация за: принадлежност към част на речта (при лексемите), произход (при чуждите думи), стилистични и граматични особености, значения, синоними и антоними (когато такива съществуват). При необходимост се дават и кратки примери, илюстриращи употребата на съответния неологизъм в контекст (вж. Фигури 8 и 9).

Фигура 9. Речниковата статия за съществителното име автобронзант в Неологичния речник

Фигура 9. Речниковата статия за съществителното име автобронзант в Неологичния речник

Фигура 10. Речниковата статия за прилагателното име генномодифициран в Неологичния речник

Фигура 10. Речниковата статия за прилагателното име генномодифициран в Неологичния речник

Търсенето в речника се осъществява по низ от символи, което дава възможност за извеждане на всички думи или съчетания, в които присъства съответната поредица от символи (вж. Фигура 10).

Фигура 11. Търсене в Неологичния речник по низ „кредит”

Фигура 11. Търсене в Неологичния речник по низ „кредит”

2.4. Регистър на фразеологизмите

Съставен е въз основа на съществуващите фразеологични речници на българския език (Ничева и др. 1974; Анкова-Ничева 1993), с цел да се даде възможност на потребителите да намират бързо и по достъпен начин информация за това в кой лексикографски труд може да се направи справка за семантиката и стилистичната квалификация на съответни фразеологични единици.

Системата за търсене в регистъра извежда списък с всички фразеологизми, съдържащи дадена дума, като към всяка фразеологична единица се посочва източникът, от който тя е извлечена (вж. Фигура 11).

Фигура 12. Търсене в Регистъра на фразеологизмите

Фигура 12. Търсене в Регистъра на фразеологизмите: фразеологични единици, съдържащи съществителното решето

Търсенето по низ от символи (вж. Фигура 12) е удобно средство в случаите, когато се цели изследване и сравняване на фразеологичния потенциал на различни думи, например такива, принадлежащи към общо словообразувателно гнездо.

Фигура 13. Търсене в Регистъра на фразеологизмите по низ „приказва”

Фигура 13. Търсене в Регистъра на фразеологизмите по низ „приказва”

Заключение

Представените бази от данни, включени в информационния лингвистичен портал „Инфолекс“, са полезен и ценен електронен ресурс, подпомагащ провеждането на различни по характер научни изследвания и извършването на справки в областта на българската лексикология, фразеология и лексикография. Те удовлетворяват потребността както на учените българисти, така и на по-широк кръг потребители (преподаватели, студенти, ученици, чужденци, изучаващи български език, и всички, които се интересуват от лексикалното богатство на българския език) от качествени, професионално изработени и лесно достъпни уеббазирани лингвистични и библиографски бази от данни.

В настоящия момент ресурсите от информационния лингвистичен портал „Инфолекс“ работят в тестов режим. След завършването на работата върху тях порталът ще бъде достъпен за свободно ползване. Неговият адрес може да бъде намерен на интернет страницата на Института за български език „Проф. Любомир Андрейчин“ при БАН (http://www.ibl.bas.bg/).

Благодарности

*. Авторите изказват благодарност на Фонд „Научни изследвания“ при МОМН на Република България за финансовата подкрепа при извършване на представеното изследване (Договор ДТК 02-52/2009 г.).

Цитирана литература

  • Анкова-Ничева, Кети. 1993. Нов фразеологичен речник на българския език. София: УИ „Св. Климент Охридски".
  • Ничева, Кети, Сийка Спасова-Михайлова, Кристалина Чолакова. 1974. Фразеологичен речник на българския език. Т. 1–2. София: БАН.
  • Пернишка, Емилия. 2003. Синонимен речник на българския език (с антоними и близкозначни думи). Пловдив: Хермес.
  • Пернишка, Емилия, Диана Благоева, Сия Колковска. 2001. Речник на новите думи и значения в българския език. София: Наука и изкуство.
  • Пернишка, Емилия, Диана Благоева, Сия Колковска. 2010. Речник на новите думи в българския език. (от края на ХХ и началото на XXI век). София: Наука и изкуство.
  • Пернишка, Емилия, Стефка Василева. 1997. Речник на антонимите в българския език. София: Петър Берон.
  • Речник на българския език. 1977–2012. Т. 1–14. София: БАН.

За авторите

Д-р Диана Благоева е доцент в Института за български език „Проф. Л. Андрейчин“ при БАН, ръководител на Секцията за българска лексикология и лексикография. Научните ѝ интереси са в областта на лексикологията, лексикографията, корпусната лингвистика, съпоставителното изучаване на славянските езици.

Електронен адрес / E-mail: diablag at mail dot bg

Д-р Сия Колковска е доцент в Секцията за българска лексикология и лексикография към Института за български език „Проф. Л. Андрейчин“ при БАН. Научните ѝ интереси са в областта на лексикологията, лексикографията, терминологията, компютърната лeксикография.

Електронен адрес / E-mail:sia_btb at yahoo dot com