Департамент анализа данных и искусственного интеллекта


НазваниеДепартамент анализа данных и искусственного интеллекта
страница3/14
ТипДокументы
1   2   3   4   5   6   7   8   9   ...   14

Захарьящев Михаил Викторович



http://www.dcs.bbk.ac.uk/~michael/


  1. Ontology-Based Data Access.

  2. Description Logic.


http://cs.hse.ru/data/2015/05/20/1097298008/talk-HSE-seminar-topics.pdf
Level: graduate (4 year)\master\postgraduate 

Игнатов Дмитрий Игоревич


 

Условные обозначения

Б – работа уровня бакалавриата

М – работа уровня магистратуры

П+ – требует реализации алгоритмов

П – требует программирования для предобработки данных

Задачи от компании ЗАО «Рекомендата» (Imhonet.ru)

    1. Меры оценки качества рекомендательных систем. (Литературный обзор и эксперименты.) (БМП+)

    1. Музыкальные рекомендации на основе моделей ранжирования на графах. (БМП+)

    1. Рекомендательные системы на основе ассоциативных правил. (БПМ+)

    1. Модель принятия решений для бинарных ответов рекомендательной системы

(Модель принятия решений. Модели для трансляции оценок в бинарный ответ.) (БМП+)

    1. Онтология пользователей на основе профилей оценивания в рекомендательных системах. (БП или БМП+)

    2. Разработка и применение онтологии книг в рекомендательном сервисе «Имхонет». (БП или БМП+)

    3. Исследование результатов больших массивов данных онлайн-опросов методами машинного обучения. (БП или БМП+)

Курсовые

    1. Методики оценки качества рекомендательных систем. (БМ или БМП или БПМ+)

    1. Разработка лабораторной работы по рекомендательным системам. (БМП или БПМ+)

    1. Разработка лабораторной работы по анализу последовательностей. (БМП или БПМ+)

    1. Разработка лабораторной работы по применению карт Кохонена. (БМП или БПМ+)

    1. Исследование публикационной активности методами анализа формальных понятий. (БМП или БМП+)

    2. Разработка лабораторной работы по анализу данных систем совместного доступа к ресурсам (Flickr, Bibsonomy, Delicious и др.). (БМП или БПМ+)

    3. Разработка лабораторной работы по методам анализа социальных сетей. (БМ или БМП или БМП+)

    1. Исследование качества основных методов машинного обучения для задачи анализа мнений (Opinion Mining, Sentiment Analysis). (БМП+)

    1. Решение реальных задач машинного обучения и разработки данных ресурса Kaggle. (БМП или БМП+)

    1. Анализ данных в области образования (Educational Data Mining). (БМП или БМП+)

Темы ВКР

    1. Исследование публикационной активности методами разработки данных (Data Mining). (БМП или БМП+)

    1. Разработка данных в социологии. (БП или БП+)

    1. Разработка данных в образовании. (БП или БП+)

    1. Методы оценки качества рекомендательных систем. (БМП+)

    1. Рекомендательные системы на основе трикластеризации (для анализа фолксономий). (БМП+)

    1. Машинное обучение для анализа мнений пользователей Интернет-ресурсами. (БМП+)

    1. Консенсусная кластеризация на основе решеток понятий. (БМП+)

    1. Рекомендация радиостанций для онлайн-радиосервиса. (БМП+)

    1. Анализ данных геоинформационные систем (данные об океане). (БП или БП+)

    2. Рекомендательная система парфюмерной продукции, учитывающая контекстные данные. (БМП+)

    1. Би- и трикластеризация для анализа данных социальных сетей. (БП или БМП+)

    1. Математические модели и алгоритмы для краудсорсинговых платформ. (БМП и БМП+)

    1. Методы би- и трикластеризации для анализа данных генной экспрессии. (БМП+)

Задачи компании «Имхонет»

1. Исследование результатов больших массивов данных онлайн-опросов методами машинного обучения.

Данные.

Ответы пользователей на простые вопросы.

Что требуется компании.

Предложить методы угадывания ответов на вопросы и моделировать процесс угадывания. (В т.ч. существуют целевые вопросы, на которые хотелось бы знать максимально точный ответ.) Разработать оптимальные метрики для поиска близких пользователей и близких вопросов.

Предложения способов классифицировать и кластеризовать пользователей на основе опросника (включая моделирование).

Предложения способов классифицировать и кластеризовать вопросы и/или ответы (включая моделирование).

Способы интерпретации фактов пропуска ответов. Как включить эту информацию в модели.

Как учесть в моделях экспертную классификацию вопросов (теги).

2. Разработка и применение онтологии книг в рекомендательном сервисе «Имхонет».

Рассмотреть модели инкорпорирования онтологии в разреженную матрицу оценок.

Агрегировать оценки, используя имеющуюся книжную онтологию и оценки базы данных Имхонета.

A.Sieg, B. Mobasher, R. Burke; Improving the effectiveness of collaborative recommendation with ontology-based user profiles: HetRec 2010, pp.39-46

3. Онтология пользователей на основе профилей оценивания в рекомендательных системах.

Данные

Оценочные профили пользователей в кино и других разделах.

Что требуется компании.

Предложить модель для классификации оценочных профилей пользователей.

Как лучше использовать оценки разных типов оценочных профилей в РС?

Подробнее:

- какие типы профилей более надежны, а какие менее?

- можно ли компенсировать особенности разных типов профилей для улучшения работы РС (например, весами или изменением значений оценок)?

(Здесь можно экспериментировать, например, на базе факторизации.)

Как рано можно предсказать будущий тип профиля (сколько оценок)?

Связь типов профилей с другими характеристиками пользователей (соц. дем., опросник).

4. Модель принятия решений для бинарных ответов рекомендательной системы

(Модель принятия решений. Модели для трансляции оценок в бинарный ответ.)

Данные.

Прогнозы оценок, сделанные системой, профили пользователей, другие вспомогательные данные - например, профиль из опросника.

Что требуется компании.

Предложить модель принятия решений для рекомендательного сервиса, отвечающую на потребительские вопросы смотреть/не смотреть, слушать/не слушать, читать/не читать.

Модели для трансляции оценок в бинарные/тернарные ответы.

5. Рекомендательные системы на основе ассоциативных правил.

Данные.

Оценочные профили пользователей.

Что требуется компании.

Проверить разные модели и выбрать подходящие на данных о кино и книгах.

Гипотеза: стоит использовать алгоритмы, которые умеют выявлять редкие правила с большим уровнем достоверности (confidence).

6. Музыкальные рекомендации на основе моделей ранжирования на графах.

Данные.

Данные о музыке MSD, плейлисты пользователей социальной сети «Вконтакте», данные lastfm скроблинга (см. термин http://www.lastfm.ru/help/faq?category=99), оценки imhonet.

Что требуется компании.

Рабочие модели ранжирования предпочтений пользователей, одновременно учитывающие большое множество очень разнородных данных.

В этой задаче с самого начала нужно иметь в виду проблему производительности.

http://eagle.zju.edu.cn/~lijun/pdf/MM-2010-Bu.pdf

7. Меры оценки качества рекомендательных систем.

(Литературный обзор и эксперименты.)

Что требуется компании.

Понимание, в каких ситуациях какие метрики лучше использовать.

Интересно было бы просмотреть/проиндексировать максимум количества работ (или более-менее репрезентативную выборку, чтобы посмотреть временные зависимости - как менялись самые предпочитаемые метрики, и зависимость от контента.

Исследовать метод агрегирования оценок и его подстановки в факторный фильтр на базе онтологии книг (https://dl.dropbox.com/u/49259983/p39-sieg.pdf)

с данными Имхонета и сравнить результат с обычной фильтрацией (без метаданных).

Использовать готовый пакет для метода подстановки мета-данных непосредственно в коллаборативную схему (http://apex.sjtu.edu.cn/apex_wiki/svdfeature) через поиск коэффициентов линейной комбинации к группам факторов, определяемыми метаданными.

Подробнее (стр. 5 формула 1): http://svdfeature.apexlab.org/wiki/images/d/d1/Svdfeature-manual.pdf

- опять-таки с данными Имхонета.

Сравнить подход с уже реализованными методами компанией Имхонет.

 

 

 

1   2   3   4   5   6   7   8   9   ...   14

Похожие:

Департамент анализа данных и искусственного интеллекта iconАктуальные проблемы кластерного анализа
В большой степени развитию этой дисциплины способствовало проникновение в сферу анализа данных идей, возникших в теории искусственного...

Департамент анализа данных и искусственного интеллекта iconЛитература: Попов «Экспертные системы»
Основные исследования, которые ведутся в области искусственного интеллекта. Понятие и структура интеллектуальной системы 2

Департамент анализа данных и искусственного интеллекта iconВзаимодействие выражений анализа данных и многомерных выражений
Инструкции dax вычисляются для находящегося в памяти хранилища реляционных данных, состоящего из таблиц и связей в книге PowerPivot....

Департамент анализа данных и искусственного интеллекта iconМ. А. Холодная Психология интеллекта: парадоксы исследования
Существует ли интеллект как психическая реальность? (причины кризиса тестологических теорий интеллекта)

Департамент анализа данных и искусственного интеллекта iconСловом можно убить, Словом можно спасти, Словом можно полки За собой...
Рик Бриггс назвал санскрит идеально пригодным языком для изучения проблем искусственного интеллекта: не утратив своей выразительности,...

Департамент анализа данных и искусственного интеллекта iconИнформированное добровольное согласие на проведение искусственного...
Федерального закона от 21 ноября 2011 г. N 323-фз "Об основах охраны здоровья граждан в Российской Федерации" настоящим подтверждаю...

Департамент анализа данных и искусственного интеллекта iconЮ. Я. Кацман статистическая обработка экспериментальных данных
Целью данной работы является изучение основных статистических методов анализа и интерпретации экспериментальных (случайных) данных...

Департамент анализа данных и искусственного интеллекта iconТест структуры интеллекта (tsi) Р. Амтхауэра
Эта идея единства структур способностей послужила основой многих интеллектуально-профессиональных тестов, в частности, теста структуры...

Департамент анализа данных и искусственного интеллекта iconТест структуры интеллекта (tsi) Р. Амтхауэра Обзор
Эта идея единства структур способностей послужила основой многих интеллектуально-профессиональных тестов, в частности, теста структуры...

Департамент анализа данных и искусственного интеллекта icon«социология и политология»
Методы в зависимости от типа социологических исследований подразделяются на качественные и количественные, а в зависимости от этапа...

Вы можете разместить ссылку на наш сайт:


Все бланки и формы на filling-form.ru




При копировании материала укажите ссылку © 2019
контакты
filling-form.ru

Поиск