Курс "Обработка нечисловой информации"

  Главная | Форум  
     
 
Навигация
Программа курса
Содержание лекций
Материалы курса
Лабораторные работы
Требования к экзамену
Другие материалы

Гостевая книга
Форум

 

Лабораторные работы

 

Лабораторная работа 1 - SENAN

18/01/08

Цель работы:

1. Увидеть - как работает язык совершенно другого типа - декларативный язык Пролог

2. Научиться изменять действующую программу на Прологе в соответствии со своим замыслом

3. Просто самому сделать свой парсер и увидеть, что это легко и просто. Синтактику можно дополнить семантикой - т.е. сделать небольшой проект, где после грамматического разбора производится какое-либо небольшое действие. Авторы примера назвали его семантическим анализатором. Это такой же риторический ход, как называние ИТ систем управления знаниями, когда они просто предоставляют нужную структурированную информацию для принятия последующего решения человеком. В этом примере только разбор синтактики. Но - семантикой этот хороший примерчик можно дополнить самому, изменив, согласно своему замыслу изначальную синтактику.

4. Сделать эту (и другую) лабораторную надо обязательно. Это сделали уже многие и их работы выложены на сайте. Нужно просто разобраться в информационной ситуации, сгенерировать замысел и воплотить его. Неспособность сделать это можно смело уподобить неспособности продифференцировать х квадрат или проинтегрировать xdx, имея тем не менее желание рассуждать о матанализе с целью получить положительную оценку на экзамене.

Описание программы

Текст программы SENAN

Дополнительная информация есть также на странице - требования к зачету

 

Лабораторная работа 2 - GEOBASE

18/01/08

Цель работы:

1. Увидеть - как работает язык совершенно другого типа - декларативный язык Пролог

2. Научиться изменять действующую программу на Прологе в соотвествии со своим замыслом

3. Самому сделать небольшую, но эффективную программу, обрабатывающую запрос на ЕЯ к БД (почти что базе знаний - см. материалы курса)

4. Сделать эту (и другую) лабораторную надо обязательно. Это сделали уже многие и их работы выложены на сайте. Нужно просто разобраться в информационной ситуации, сгенерировать замысел и воплотить его. Неспособность сделать это можно смело уподобить неспособности продифференцировать х квадрат или проинтегрировать xdx, имея тем не менее желание рассуждать о матанализе с целью получить положительную оценку на экзамене.

Описание программы

Текст программы GEOBASE

Дополнительная информация есть также на странице - требования к зачету

 

Ссылки на дополнительные материалы по лабам - SENAN и GEOBASE

18/01/08

ThoughtTreasure brings natural language and commonsense capabilities to computers and devices

Lojban Parser

An NSF Workshop: Language Engineering for Students
An NSF Workshop: Language Engineering for Students
and Professionals Integrating Research and Education
NEW: software tools developed during the workshop now available for download

Visual Prolog
Visual Prolog 6 is a complete programming environment, which contains everything needed for building large-scale commercial applications: complete graphical development environment, compiler, linker and debugger.

Турбо Пролог с обоими лабораторными программами
В отличие от Visual Prolog''a программа SENAN в Турбо Прологе рисует дерево разбора.

Программа SENAN в Турбо Прологе - рисует дерево разбора
Уже в оттранслированном виде

Хомский
Спросить лингвиста (особенно западного) кто такой Хомский все равно, что спросить старого партийца кто такой Сталин.class="link"

Хомский - конкретно

Хомский - архив

TO_DO!!! Некоторые интересные примеры парсинга

Много лингвистических ресурсов
Satoshi SEKINE Assistant Research Professor
Interest
Natural Language Processing, i.e. mechanical implimentations of human languages and the science behind it. Topics I''m working on and I have been working on are:
English analyzer
Building sentence splitter, tokenizer, stemmer, POS tagger, chunker, NE tagger, Dependency analyzer and parser combining corpus-based and hand crafted methods. (OAK system) Information Extraction
Extract essential points from documents automatically. (HLT-01, ICCPOL-99)
QA Answer to questions based on facts writen in newspaper (currently working on Japanese system).
Summarization Text and speech summarization using various features. Our system achieved the best prformance in DUC-1 single document summarization evaluation (average of all subjective measurements). (DUC-01)
Japanese Analyzer Statistical based Japanese morphological analyzer and dependency analyzer. Also Finite state method on dependency analyzer.

 

Примеры сданных работ

18/01/08

Примеры сданных работ можно посмотреть здесь


   
Главная | Программа курса | Содержание лекций и курса | Литература и материалы курса
Лабораторные работы | Требования к экзамену | Другие материалы | Гостевая книга | Форум
Сайт управляется системой uCoz