Skip to content Skip to navigation

Електронни езикови ресурси и инструменти в електронното обучение – цел или средство?

Електронни езикови ресурси и инструменти в електронното обучение – цел или средство?

Елена Паскалева

(ИПОИ – БАН, hellen@lml.bas.bg)

 

За прочита на понятието “електронно обучение”.

Електронното обучение в славистиката, както и във всяка езиковедска дисциплина, може да има няколко различни методологични прочита:

1. Използване на компютърни средства за обучение в традиционно преподавани езикови дисциплини. В този случай компютърът илюстрира само отделни компоненти от процеса на предаване, усвояване и проверка на знанието, без да се интересува от съдържанието му. Освен стандартното изискване за структуриран и подреден материал и за начини на проверка и изпитване, съобразени със спецификата на компютърното представяне и онлайн процедури, съдържанието на усвояваното знание не се различава от това в хартиените учебници.

2. Използване на компютърни езикови ресурси и инструменти от арсенала на компютърната лингвистика, независимо от начина на обучение (електронно или традиционно), с компютърни демонстрации, моделиращи фрагменти от лингвистичното знание и сериозна лингвистична база данни.

3. Истинско компютърно обучение в най-точния и тесен смисъл на думата, по формулировката на класиците, като например:

  • разделени учител от ученик, компютърна мрежа, двупосочна комуникация (Keegan, 1998);
  • учебното съдържание – онлайн, автоматична обратна връзка, идваща от ученика, взаимодействие на ученика с материала, а не с учителя и другите ученици (Paulsen 2003);

Третият тип електронно обучение предполага и използването на специализирана компютърна платформа от типа на MOODLE.
Независимо от вида на електронното обучение, всеки негов курс изисква:

  • да се структурира учебният материал в последователност от уроци;
  • да се фиксира ресурсната и технологичната база за всеки урок от курса, като се определи материалът за усвояване, материалът за изпитване и методите на изпитване и оценка;

Езиковите технологии и участието им в компютърното обучение

Продукти на езиковите технологии – цели и съдържание

Наличните, както и непрекъснато създаваните компютърни ресурси и средствата за тяхната обработка, обслужват различни страни на компютърното производство. Те преследват както приложни цели – да служат за компоненти на различни езикови технологии, така и изследователски – да се моделират различни фрагменти от лингвистичното знание. В изследователския си аспект те боравят с лингвистично знание от различни равнища на представянето – от чисто текстовото към морфологичното, синтактичното и семантичното, с различна степен на покритие на реалните езикови явления. Подобни приложения, подпомагащи изследователската дейност, обикновено са ориентирани по създаване и оценка спрямо две линии – тази на ресурса, компютърно събиран, представен и обработван емпиричен материал, който служи за изследователска база, и тази на обработката – компютърни прототипи, моделиращи процесите на дадено езиково равнище с входна и изходна информация, с връзки между данни и резултати.

 

Равнища на моделираното и обработвано лингвистично знание в езиковите технологии

Според единиците на обработката и носената от тях информация продуктите на езиковите технологии се разполагат в равнищата на:

  • текста: всички видове честотни речници, конкордански, процедури за търсене по ключови думи, задавани като проста текстова последователност;
  • морфологията: моделират се процесите на граматическия анализ (с и без снемане на граматическа многозначност) и синтез (моделиране на процеса на формообразуване), а ресурсната база се състои от граматически речници (вж. по-долу) и изчерпващи правила на формообразуването;
  • лексикографските колекции (речници) от различен тип: граматически, тълковни, семантични, двуезични;
  • синтаксиса: като инструмент (синтактични анализатори – парсери) и като резултат от организирани на това равнище ресурси (синтактичните банки1);
  • семантиката: организация и описание на основни езикови онтологии и семантично организирана лексика (от типа на WordNet, вж. );
  • в плоскостта на многоезичието: дву- и многоезични компаративни изследвания на равнище дума и фраза, процедури за извличане на преводни еквиваленти с различна степен на автоматизация, автоматична оценка на точността на преводи, съставяне на двуезични глосарии, софтуерни средства за подравняване на паралелни корпуси на различни езикови равнища.

 

Продуктите на езиковите технологии от гледна точка на крайния потребител

Като от изброените по-горе продукти се изключат такива, които са вградени в големи интегрални системи за автоматична обработка на текст като INTEX (Silberztein 1993).

CLARK2 в ролята на техен скрит междинен компонент, останалите приложения могат да бъдат предоставяни на крайния потребител – лингвист в различна степен на достъп до входна и изходна информация, както и в етапите на обработка. Една класация по степента на използваемост (usability) би разграничила следните видове достъп, осигурен на изследователя, обучавания и обучаващия. Тази използваемост варира в следните граници:

  1. Пълно и свободно в различна степен (free или shareware) предоставяне на въпросния продукт от мрежов сървър, заедно с вътрешните му данни. Такива са по-голямата част от разработените за английски език морфологични анализатори със снемане на граматичната многозначност (известни под името тагери – taggers). Очевидната зависимост между дълбочината на езиковата обработка в продукта и неговата използваемост произтича от настройката му към конкретен език (тагерът предполага ползването на определена система за граматична анотация за този език), оттук и стесняването на приложимостта му не само към друга граматична концепция, но и към друг език. WEB-средата в случая е само хранилище на продукта и вход към неговата доставка.

  2. Предоставяне на продукт, реализиран като голяма база данни (с възможности за търсене по различни езикови параметри). Самата идеология на представянето като база данни предполага възможности за обновяване, интерактивност и диагностика на грешки. В такъв вид се предоставят например граматически речници, с богата информация за словоформите на езика и лексикално-граматическите им характеристики. На фиг.1 е представен екранът на един вид справки в подобен речник. Принципът на справки в такава система е описан в (Paskaleva 2005] и (Паскалева 2007)

Морфологичен речник

Фиг. 1. Изпълнение на заявка за търсене на словоформи с крайна буквена верига -ция и граматични стойности – прилагателно и съществително. Както личи от списъка операции в дясно, възможни са разнообразни корекции в списъка и отделните му елементи.

  1. Ползване (предимно в WEB-среда) на пълните възможности на продукт за обработка на големи текстови порции, предоставени от потребителя. Такава възможност се предоставя в сайта на проекта BALRIC-LING – морфологичен анализ в системата на вътрешния граматически речник на системата.3
  2. Използване на процедури, проектирани за създаването на големи бази от граматично знание, за изучаване на механизмите на същото това знание. В илюстрирания по-долу случай става дума за пълно моделиране на елементите на българското формообразуване – морфологичен синтез), чийто интерфейс служи за илюстрация на механизмите на моделираното явление в изчерпателния им обем и функционални връзки. Фиг.2 показва начина на запълване на глаголната парадигма за нов флективен (формообразуващ) глаголен тип.

Морфологичен анализатор

Фиг. 2. Изчисление на стойностите на окончанията на 4 глаголни форми на сег. вр. по зададени 2 основни (отбелязани с К). Виждат се 10-те модула на глаголното спрежение, чиито връзки – вътре в модулите и между тях позволяват да се получи пълната глаголна парадигма от 54 форми само чрез задаване на 8 стойности – котви.

Разликата между процедури от типа 2. и 4, които фактически представят един и същ фрагмент на граматичното знание, са подобни на разликите в дегустацията на едно ястие и изучаването на тънкостите на неговата рецепта. Като такива, резултат и процес, те биха могли да бъдат използвани и във всяко обучение по морфология – първите като база за подготовка на учебен материал от преподавателя, а вторите – като проверка на усвояването на механизмите на преподаваното явление.

Извън тази класация са всички видове отчети и подробни описания на продукти на езиковата технология, снабдени с връзки „Demo”, където на читателите се предлага “на вяра” готова илюстрация на входа и изхода на процедура, скрита от погледа им.

Възможност за ползване на продуктите на езиковите технологии в електронното обучение

За целите на електронното обучение, разбирано в най-широк смисъл – като арсенал от компютърни средства, подпомагащи стандартния процес на усвояване на учебен материал, подобни на описаните продукти могат да бъдат използвани в оригиналния си вид. От учителя – за подготовка на учебен материал, от ученика – за проверка на знание и упражнение. Колкото по-„дружелюбен” е интерфейсът на подобен продукт, толкова по-ефективно ще е използването му в интерактивен процес на проверка и корекция на знание.

За целите на електронно обучение, разбирано в по-тесен смисъл (вж. определенията в началото), подобни продукти биха могли да бъдат третирани като скрит ресурс, ползван от учителя за подготовка на тестов материал, за проверка и оценка на знанието чрез сравнение с базата данни на продукта, и като материал за самостоятелна подготовка.

Възможни бъдещи разширения на демонстрираните продукти може да се търсят в използване на наличния интерфейс в подобни „дружелюбни за лингвиста” приложения. Те биха могли да формират изолиран учебен модул за усвояване на фрагмент от лингвистично знание в глобална среда за обучение от типа на MOODLE.

Бележки / Notes

1. http://www.bultreebank.org

2 http://www.bultreebank.org/clark/index.html

3. http://www.larflast.bas.bg/balric/index/index.htm - демонстрация на морфологичен анализатор

 

Цитирана литература / References

  • Паскалева, Елена 2007. Компютърна морфология – ресурси и инструменти. ИПОИ, БАН. 182 с. ISBN 978-954-92148-1-9.
  • Keegan, D. 1998. Problems in defining the field of distance education. The American Journal of Distance Education 2(2). 4-11
  • Paskaleva, E. 2005. Compilation and validation of morphological resources. In: Piperidis, S. and Karkaletsis, V. (еds.). Proc. First Workshop on Balkan Language Resources and Tools, November 2003, Thessaloniki, Greece, a satellite event of the Balkan Conference on Informatics. 68-74.
  • Max Silberztein, Max 1993. Dictionnaires électroniques et analyse automatique de textes: le système INTEX. Paris: Masson. 240 p.
  • M. Paulsen, M. 2003. Online Education: Learning Management Systems. Norway: NKI. ISBN 8256258942.