Курс "Обработка нечисловой информации"

  Главная | Форум  
     
 
Навигация
Программа курса
Содержание лекций
Материалы курса
Лабораторные работы
Требования к экзамену
Другие материалы

Гостевая книга
Форум

 

Новости

 

Сдача Экзамена!!!

18/01/08
     ВНИМАНИЕ!

Появились материалы для сдачи экзамена! Следите за изменениями на этом сайте!

Полную информацию об экзамене смотрите на этой странице ниже

Экзамен будет проходить начиная с 20-х чисел декабря 2007 г. и до 20-х чисел января 2008 г - конца сессии предположительно по субботам.

| Материалы к экзамену

 

NEW !!! NEW !!! NEW !!!

18/01/08

Начало занятий в весеннем семестре в субботу 16 февраля 2008 г. в 426 ГК в 17 час

См сайт Курса "Управление знаниями"

http://ryk-kypc2.narod.ru/

 

NEW !!! NEW !!! NEW !!!

18/01/08

Cледующий день сдачи экзамена (после 12 января на госе 6 курса на Первомaйской 51) будет в субботу 26 января в 12 час в районе 426 ГК.

 

NEW !!! NEW !!! NEW !!!

18/01/08

Образцы некоторых уже сданных работ Работы Буравилиной и Беляева уже на сайте http://ryk-kypc1.narod.ru/z671.zip

 

NEW !!! NEW !!! NEW !!!

18/01/08

Темы лаб:

SENAN - уже не будут приниматься любые преобразования времен и существительных и прилагательных

GEOBASE - уже не будут приниматься любые преобразования самых длинных рек и вершин

 

NEW !!! NEW !!! NEW !!!

18/01/08

Вопрос по выбору

1. Можно брать темы из программы - и смотреть - что о них пишут в Сети - и резюмировать это в свете изученного материала

2. Можно почитать ИТ журналы и попытаться объяснить некоторые описанные там события и явления - опять же - в свете изученного материала

 

NEW !!! NEW !!! NEW !!!

18/01/08

По предложению трудящихся в лице старосты решено экзамен проводить с 12 до 14 час - в районе 426 ауд

 

NEW !!! NEW !!! NEW !!!

18/01/08

Первые дни сдачи экзамена 22 и 29 декабря и 5 января 2008 - в субботу (426 ГК в 12 час). Если 426 будет занята - ищите рядом - но я постараюсь написать на двери.

Если после 13 час никого не будет и не будет информации о желании явиться для сдачи - я могу уйти. Предупреждайте (лучше по СМС - или за 1-2 дня по эл почте) об этом.

12 января в субботу я буду на госэкзамене в RTSOFT - так что можно приезжать туда

ГОС для 225 группы будет проходить в здании РТСофт по адресу: ул.Верхняя Первомайская, д.51, М.Первомайская
см сайт www.rtsoft.ru от 10 утра.

Текущая информация будет здесь на сайте

Возможны далее изменения из-за праздников и других обстоятельств

 

NEW !!! NEW !!! NEW !!!

18/01/08

Совет - не берите заумные темы для вопроса по выбору А если берете - то сумейте отвечать на вопросы по этой теме) - а разберитесь хорошо в к-л изложенном на лекциях и выложенном на сайте материале
Посмотрите также ссылки внизу. Если уж взяли заумную тему - привяжите ее идеи и терминологию к той классике, которая излагалась в курсе.

Еще раз - в чем смысл отдельных частей курса

1. Семиотика - что такое знаки и что в них можно изучать

2. ОФ - правила обращения с текстом - как знаковые произведения (ЗП) материализуются конкретно - в устной, письменной, ... , машинной фактуре. Оказывается это совсем не одно и то же.

3. Риторика. Как уже материализованное ЗП сделать эффективным - заставить человека купить товар (рекламное ЗП), заказать его через сайт (Web дизайн) и т.д.

Правила, универсалии, законы выглядят примитивно - но совсем нетривиально уметь их понять и применить в конкретных приложениях - конкретно ИТ бизнеса - для чего все это и изучается. И о чем будет (или уже - для сдавших) спрашиваться.

 

ВНИМАНИЕ !!!

18/01/08

!!!!!!!!!!!!!!!!!!!!!!!!!

Пересдача хх января в хххх - там же и тогда же

Пересдающим

Работы по SENAN больше НЕ будут приниматься с парсингом сложных имен и вопр предложений - и равные по сложности

Также по GEOBASE - не принимаются лабы с простейшими вычислениями площадей и периметров - и т.п.

Не обижайтесь

Последний день сдачи экзамена будет в ххх января в 17 час в 426 ауд ГК (или рядом - если 426 будет занята).

Первый день сдачи - середина декабря (будет уточнено) - результаты будут выкладываться. Уже сейчас можно посмотреть работы за прошлые годы.

Лучше лабы приносить на своем ноутбуке. Можно и на флешке - ноутбук будет. Обязательно должен быть компилятор Пролога для возможного перекомпилирования если будет задан вопрос

 

NEW !!! NEW !!! NEW !!!

18/01/08

Начало занятий 22 сентября 2007 г. в 426 ГК в 17 час в субботу

Начало экзамена в 2007 - 2008 уч. году -

Первые дни сдачи экзамена (начало экзамена) - 2007 года будут объявлены в начале декабря - см. выше

 

NEW !!! NEW !!! NEW !!!

18/01/08

Дни сдачи экзамена после Нового года - будут объявлены позже.

В стекляшку приезжать сдавать не надо!!!

Последний день сдачи экзамена ... будет объявлен позже

 

NEW !!! NEW !!! NEW !!!

18/01/08

Работы 2005 года по SENAN -

В основном - обновления БД (если вводится неизвестное слово), работа с морфологией (узнавать слово newest если в БД есть слово new), установление эквивалентности разных предложений.

Не бойтесь тупую синтактику дополнить семантикой!

Проявите риторическое изобретение!


Работы по GEOBASE были довольно однообразные

Будут и уже выложены лабы и самые интересные вопросы по выбору.

 

NEW !!! NEW !!! NEW !!!

18/01/08

Информация о зачете будет обновляться на сайте по мере изменения оперативной обстановки.

Не дергайте меня по мелочам. Вся инфо будет здесь на сайте

Если опаздываете на экзамен (после 18 час.) - пошлите СМС.
Если после 18 час никого не будет - экзамен прекращается и переносится на след день

Будьте особенно внимательны в последний день экзамена! Приезжайте вовремя - к 17 часам. Никто вас не будет ждать в пустой аудитории после 18 час!

Подготовьте пожелания - какие дни лучше - но скорее всего экзамен будет по пятницам с 17 час со второй половины декабря до 20-х чисел января в аудитории 426 или рядом (в крайнем случае на двери 426 будет надпись).

 

NEW !!! NEW !!! NEW !!!

18/01/08

Предлагаю обратить внимание на работу Ремневой - все сделано грамотно - вплоть до вопроса по выбору - грамотно разобрана проблема "писем счастья" с точки зрения ОФ - авторство, копирование и т.д.

Многие приносят скачанные тексты, которые сами не могут объяснить

Так делать нехорошо.

 

NEW !!! NEW !!! NEW !!!

18/01/08

Если кто сможет приехать со своим ноутбуком (т.е. полностью автономно) и сдать и лабы и теорию - приезжайте. Так лучше

 

NEW !!! NEW !!! NEW !!!

18/01/08

Если есть конструктивные соображения - пишите.

Еще раз -Сопровождать лабы краткими письменными описаниями и характерными примерами их работы

 

NEW !!! NEW !!! NEW !!!

18/01/08

Далее - после Нового года экзамен 1 раз в неделю с коррекцией на праздники - следите за объявлениями на этом сайте.

БЛАГОРАССМОТРИТЕЛЬСТВУЕМЫМИ будут считаться студенты, которые привели с собой ослабевших или нерадивых товарищей (при условии, что они выполнили все требования и готовы сдавать)

Еще более БЛАГОРАССМОТРИТЕЛЬСТВУЕМЫМИ будут рассматриваться студенты, выбравшие этот курс как курс по выбору. Только приходить сдавать нужно с отрывным.

Для успешной сдачи экзамена требуется -

1. Успешно сдать лабораторные работы 1 и 2 - программы SENAN и
GEOBASE.

Сопровождать лабы краткими описаниями и характерными примерами их работы

В ОБОИХ ЛАБОРАТОРНЫХ НАДО МЕНЯТЬ НЕ БАЗЫ ЗНАНИЙ ИЛИ ДАННЫХ А КОДЫ ИХ ОБРАБОТКИ.

2. Выбрать теоретический вопрос самому, ориентируясь на темы, обозначенные в Программе курса, или из списка предлагаемых тем, описанных ниже. Этот вопрос обязательно должен быть представлен текстом объемом не менее 5-6 стр (14 pt, Times Roman) для помещения на сайт курса (если это будет сочтено достойным) для последующих поколений.

3. Уметь ответить на дополнительные вопросы по всем темам курса. В пределах теорминимума - обязательно знать ответы. Список дан ниже. Основная идея - чтобы не приходили личности, не отличающие денотат от коннотата и обижающиеся, что им не ставят зачет.

4. Обязательно знать четко азы. Определение знака. На какие части делится семиотика и какие проблемы изучает каждая часть.
К каким частям с точки зрения семиотики относится ОФ, риторика. Какие основные проблемы они изучают. Почему они нужны нам сейчас.
Как строится теория документа методом риторического изобретения, используя в качестве общих мест парадигмы семиотики, ОФ, риторики.

Это уже минимальнейший теорминимум

Good luck !!!

 

NEW !!! NEW !!! NEW !!!

18/01/08

~
Примерные темы для теоретических вопросов. Обязательный теорминимум.

~

1. Например - на сайте есть ссылка на интересную статью о семиотике маек с надписями (тоже интересный факт - точного однословного соответствия в русском английскому слову T-shirt пока нет). Разобрать эту статью. Объяснить все термины. Разобрать отдельно элементарные термины семиотики и отдельно термины более сложные - американской семиотической теории искусства, представленные в этой статье.

2. Теорминимум.

===========

2.1. Пять вопросов, на которые нужно письменно ответить, творчески проработав материал курса. По ним можно будет судить о мере понимания материала. Юмористические ответы принимаются, но не засчитываются.

1. Вопрос, ответ на который возможен сейчас.

2. Вопрос, ответ на который возможен при условии проработки дополнительных источников.

3. Вопрос, ответ на который возможен, но требует новых решений, моделей.

4. Вопрос, ответ на который невозможен, так как требует новой информации или исследований, которые пока невозможно осуществить.

5. Вопрос, ответ на который невозможен пока в принципе, поскольку имеются непреодолимые трудности.

- Идея взята из статьи в журнале Эпистемология и когнитивные науки.

============

2.2. Нужно твердо знать -

Семиотика.

Определение знака по Г.П.Мельникову. Знак, денотат, коннотат.
Семиотическая система. Синтагма и парадигма. Треугольник Фреге.

Общая филология - теория обращения с текстом (знаковым произведением).

Фактура речи. Треугольник Ю.В. Рождественского. К какой фактуре речи принадлежат тексты Интернет.
Знать парадигмы ОФ в объеме статьи О.А.Сычева (см. на сайте курса) в применении к рекламным текстам. Знать как их можно применить к процессу создания web-сайта.

Риторика - теория построения эффективного знакового произведения.

Что значит эффективность речи (коммуникации). Основные постулаты. Риторика и логика. Риторика и истина.
Образ ритора. Общие места. Назвать не менее десяти тропов и фигур.
Знать основы риторики в объеме школьного (университетского) курса - см. ссылки на сайте курса. Уметь применить их к такому виду текста как web-сайт.

Теория документа.

Описать отличия обычного текста от документа, используя парадигмы семиотики, общей филологии, риторики.

Прикладная лингвистика.

Общая схема речевой коммуникации.

Знак и слово, его значения, его смысл. Разница между значением и смыслом. Предложение и знаковое произведение.

Некоторые темы, о которых стоит подумать и о которых могут спросить -

**************

Евгений Чичваркин говорит, что в настоящее время на "Одноклассниках" зарегистрировано два "фальшивых" Чичваркина: "Эти два персонажа используют фотографии с моими изображениями, явно им не принадлежащие, состоят в сообществах учебных заведений, в которых я обучался, ведут переписку от моего имени и вводят в заблуждение реальных пользователей этого ресурса. К сожалению, это может плохо сказываться на репутации сайта".

Гендиректор сайта "Одноклассники" Альберт Попков заявил, что не знает о намерении Чичваркина обратиться в суд. По его словам, совладелец "Евросети" может самостоятельно удалить с сайта данные своих "двойников", прислав администрации портала запрос на удаление этих анкет. Попков также отметил, что создателя фальшивой анкеты можно определить по его IP-адресу

**************

Режиссер Юрий Герман - “Кадр (кино – ВР) внушает доверие и заставляет сопереживать“.

Какие части семиотики описывают упомянутые здесь явления и как их правильно семиотически описать? – А что «за кадром» - что нужно проделать нашему сознанию прежде чем кадр начинает «внушать доверие»?

**************
На госе 12 января был такой случай. Были уже заготовлены в машинном виде все протоколы на каждого студента. Как вдруг поступило ЦУ из деканата – заполнить все от руки. Откат в рукописную речь. Почему он произошел? Какие проблемы еще не были решены для протоколов в фактуре F4?

**************

Прокомментируйте сентенцию - если нация начинает праздновать чужие праздники (например - Хеллоуин и т.п. - В.Р.) - то это начало конца этой нации.

**************

Аналогично - нация не может существовать без театра - и более того - без национального театра. В Англии - это Шекспировский, в России - Малый. Почему бы это?


**************

Ответы на эти вопросы можно взять как вопросы по выбору и реконструировать ответы на них из найденного в Сети.

 

NEW !!! NEW !!! NEW !!!

18/01/08

~
Требования к сдаче лабораторных. Эффект Непейводы.

~

1. Основная идея - освоить тексты двух типовых программ обработки текста, знать как их изменить для выполнения поставленной самостоятельно близкой задачи обработки текста. Тем самым освоить практический компьютерный минимум по прикладной лингвистике.
Каждая программа дана в исходных текстах на простом, понятном языке декларативного типа (т.е. без непонятных циклов и переходов) с понятными входными и выходными данными. Если будущий специалист по информатике не может в этом разобраться и поменять в нужном месте алгоритм программы, то нужно этому научиться на примере этих двух лабораторных работ.

Две книги (Братко и Ц.Ин) по прологу есть у нас в биб-ке (они указаны в списке литературы). А книга по Visual Prolog - была в киоске (не считая того, что есть на прологовском сайте) и наверно есть в магазинах Москвы. Первые две книги - гораздо понятнее. Зато книга по Visual Prolog-у описывает нужную версию и содержит много материала (в начале) по курсу управления знаниями (материал след. семестра). Разница в версиях непринципиальна и незначительна в рамках стоящих задач.

2. Для этого придумать самому задачу, аналогичную задаче, решаемой в соответствующей программе-прототипе (SENAN и GEOBASE). Затем - исходный текст каждой из двух лабораторных изменить, чтобы в результате полученная программа могла выполнить поставленную задачу.

ВНИМАНИЕ! Менять обязательно АЛГОРИТМ - а не данные!


3. Например - программу SENAN можно адаптировать для решения задачи грамматического разбора предложения на ограниченном русском языке. Ограничить можно по-разному. Например - сделать возможным только прямой порядок слов (как в английском)и номинативы русских слов.

Более того - кроме ситактики (грам. разбора) можно добавить семантику - чтобы в получившейся программе на основе разбора были сделаны к-л действия. Это расширит круг возможных вариантов.

4. Обе лабы двойного и даже тройного назначения.

Во-первых - Prolog - это так называемый декларативный язык программирования, с которым надо быть знакомым - это входит в минимум программиста.

Во-вторых. Уметь делать простейший парсинг - то же самое. Должен уметь квалифицированный программист. С парсинга начинается компиляция программы.

В-третьих. Это язык для решения задач искусственного интеллекта, прикладной логики. Зная его, удобно рассуждать о проблемах описания, обработки знаний, рекурсии и многого другого из программы следующего семестра.

ВНИМАНИЕ! ЕЯ --->>> SQL

Особое предпочтение будет дано тем, кто сможет написать программу-клон SENANа переводящую запрос на ЕЯ (английском, ограниченном русском - например - на русском только с прямым порядком слов и все только в номинативе) в запрос на SQL. А затем обработку этого запроса.

В прошлом году была написана программа, переводящая предложение из ЕЯ в форму XML - это гораздо проще.

Но, как показывает практика, есть много вариантов - см. страницу с работами сдавших зачет.

4. В обоих лабораторных предполагается, что будет исполнено несложное (локальное) изменение алгоритма и данных с глобальным эффектом - т.е. программа-результат будет реализовывать уже другую задачу.

Непейвода этот эффект иллюстрирует так - небольшое действие (движение) мышкой - глобальные ответные действия программ компьютера.

Например - в SENAN можно задать ограниченный псевдоязык на базе русского или английского с ссответствующими группами слов, описывающих действие, его субъект и объект и т.д. - а после парсинга на выходе выполняется к-либо соответствующее (псевдо)действие.
Можно вместо парсинговых скобок, заменяющих очень наглядное дерево грамм. разбора по Хомскому, взять теги XML и конструировать к-л XML объекты на выходе.
Можно поискать в WWW прототипы по ключевым словам parsing, sample и т.п.


В GEOBASE - аналогично - можно построить небольшую БД , отражающую к-л предметную область (не обязательно географии США) и - после парсинга измененного типа запроса к этой базе знаний должен генерироваться ответ на ЕЯ.


В лабораторной по GEOBASE не засчитывается за результат добавление в атрибуты штата зоопарков, баров и т.п. Придумывайте изменения, затрагивающие более существенные свойства и связи.

5. Зазипованные лабораторные присылайте на мой адрес

Но еще лучше - приносить с собой на флешках

6. Хорошая книга по Прологу есть на сайте

books.mipt.ru

Ссылку мне дал Андрей Дробыш - у меня она что-то не вызывается - в локальной сети что ли?

 

NEW !!! NEW !!! NEW !!!

18/01/08

С 26 января 2008 года -

Пересдачи будут приниматься - см. выше. Отрывные приносить не нужно.

Следите за комментариями на сайте в разделе о требованиях к зачету - возможны непринципиальные обновления и комментарии

Последние уточнения.

1. Программы-клоны принимаются только первый экз. Никакие клятвы о
совпадениях не принимаются.

2. Последний день сдачи - будет объявлено своевременно.

3. Вопросы по выбору - обязательно сделать то, что написано вверху. Скачать и с трудом рассказать можно что угодно. Но если я увижу, что сдающий не владеет материалами курса - буду спрашивать по программе или поставлю неуд. Сдача вопроса по выбору не должна походить на чтение статьи по электронике человеком, не знающим закона Ома. Это видно, и вызывает вопросы по закону Ома и смежным проблемам.

4. Java - С. Кто-то просил написать все лабы на этих языках. Предлагаю - в качестве эксперимента кто-нибудь пусть напишет обе программы (или одну) - со всеми возможностями оригиналов и с комментариями. Почувствуете разницу.

5. Обязательно объяснять в виде текста на 1-2 абзаца с примерами что делает ваша программа. Желательно поделиться какие были проблемы и опытом их решения. Достойные работы будут выставлены на сайте.

5. Смотрите сайт - особенно разделы o зачете и лабах. Там есть
обновления.

Есть также образцы сданных работ.

С уважением

P bI K O B __ B. B.

11 января 2008 г


MOCKBA

МФТИ


   
Главная | Программа курса | Содержание лекций и курса | Литература и материалы курса
Лабораторные работы | Требования к экзамену | Другие материалы | Гостевая книга | Форум
Сайт управляется системой uCoz