Скачать 0.63 Mb.
|
Захарьящев Михаил Викторовичhttp://www.dcs.bbk.ac.uk/~michael/
http://cs.hse.ru/data/2015/05/20/1097298008/talk-HSE-seminar-topics.pdf Level: graduate (4 year)\master\postgraduate Игнатов Дмитрий ИгоревичУсловные обозначения Б – работа уровня бакалавриата М – работа уровня магистратуры П+ – требует реализации алгоритмов П – требует программирования для предобработки данных Задачи от компании ЗАО «Рекомендата» (Imhonet.ru)
(Модель принятия решений. Модели для трансляции оценок в бинарный ответ.) (БМП+)
Курсовые
Темы ВКР
Задачи компании «Имхонет» 1. Исследование результатов больших массивов данных онлайн-опросов методами машинного обучения. Данные. Ответы пользователей на простые вопросы. Что требуется компании. Предложить методы угадывания ответов на вопросы и моделировать процесс угадывания. (В т.ч. существуют целевые вопросы, на которые хотелось бы знать максимально точный ответ.) Разработать оптимальные метрики для поиска близких пользователей и близких вопросов. Предложения способов классифицировать и кластеризовать пользователей на основе опросника (включая моделирование). Предложения способов классифицировать и кластеризовать вопросы и/или ответы (включая моделирование). Способы интерпретации фактов пропуска ответов. Как включить эту информацию в модели. Как учесть в моделях экспертную классификацию вопросов (теги). 2. Разработка и применение онтологии книг в рекомендательном сервисе «Имхонет». Рассмотреть модели инкорпорирования онтологии в разреженную матрицу оценок. Агрегировать оценки, используя имеющуюся книжную онтологию и оценки базы данных Имхонета. A.Sieg, B. Mobasher, R. Burke; Improving the effectiveness of collaborative recommendation with ontology-based user profiles: HetRec 2010, pp.39-46 3. Онтология пользователей на основе профилей оценивания в рекомендательных системах. Данные Оценочные профили пользователей в кино и других разделах. Что требуется компании. Предложить модель для классификации оценочных профилей пользователей. Как лучше использовать оценки разных типов оценочных профилей в РС? Подробнее: - какие типы профилей более надежны, а какие менее? - можно ли компенсировать особенности разных типов профилей для улучшения работы РС (например, весами или изменением значений оценок)? (Здесь можно экспериментировать, например, на базе факторизации.) Как рано можно предсказать будущий тип профиля (сколько оценок)? Связь типов профилей с другими характеристиками пользователей (соц. дем., опросник). 4. Модель принятия решений для бинарных ответов рекомендательной системы (Модель принятия решений. Модели для трансляции оценок в бинарный ответ.) Данные. Прогнозы оценок, сделанные системой, профили пользователей, другие вспомогательные данные - например, профиль из опросника. Что требуется компании. Предложить модель принятия решений для рекомендательного сервиса, отвечающую на потребительские вопросы смотреть/не смотреть, слушать/не слушать, читать/не читать. Модели для трансляции оценок в бинарные/тернарные ответы. 5. Рекомендательные системы на основе ассоциативных правил. Данные. Оценочные профили пользователей. Что требуется компании. Проверить разные модели и выбрать подходящие на данных о кино и книгах. Гипотеза: стоит использовать алгоритмы, которые умеют выявлять редкие правила с большим уровнем достоверности (confidence). 6. Музыкальные рекомендации на основе моделей ранжирования на графах. Данные. Данные о музыке MSD, плейлисты пользователей социальной сети «Вконтакте», данные lastfm скроблинга (см. термин http://www.lastfm.ru/help/faq?category=99), оценки imhonet. Что требуется компании. Рабочие модели ранжирования предпочтений пользователей, одновременно учитывающие большое множество очень разнородных данных. В этой задаче с самого начала нужно иметь в виду проблему производительности. http://eagle.zju.edu.cn/~lijun/pdf/MM-2010-Bu.pdf 7. Меры оценки качества рекомендательных систем. (Литературный обзор и эксперименты.) Что требуется компании. Понимание, в каких ситуациях какие метрики лучше использовать. Интересно было бы просмотреть/проиндексировать максимум количества работ (или более-менее репрезентативную выборку, чтобы посмотреть временные зависимости - как менялись самые предпочитаемые метрики, и зависимость от контента. Исследовать метод агрегирования оценок и его подстановки в факторный фильтр на базе онтологии книг (https://dl.dropbox.com/u/49259983/p39-sieg.pdf) с данными Имхонета и сравнить результат с обычной фильтрацией (без метаданных). Использовать готовый пакет для метода подстановки мета-данных непосредственно в коллаборативную схему (http://apex.sjtu.edu.cn/apex_wiki/svdfeature) через поиск коэффициентов линейной комбинации к группам факторов, определяемыми метаданными. Подробнее (стр. 5 формула 1): http://svdfeature.apexlab.org/wiki/images/d/d1/Svdfeature-manual.pdf - опять-таки с данными Имхонета. Сравнить подход с уже реализованными методами компанией Имхонет. |
В большой степени развитию этой дисциплины способствовало проникновение в сферу анализа данных идей, возникших в теории искусственного... | Основные исследования, которые ведутся в области искусственного интеллекта. Понятие и структура интеллектуальной системы 2 | ||
Инструкции dax вычисляются для находящегося в памяти хранилища реляционных данных, состоящего из таблиц и связей в книге PowerPivot.... | Существует ли интеллект как психическая реальность? (причины кризиса тестологических теорий интеллекта) | ||
Рик Бриггс назвал санскрит идеально пригодным языком для изучения проблем искусственного интеллекта: не утратив своей выразительности,... | Федерального закона от 21 ноября 2011 г. N 323-фз "Об основах охраны здоровья граждан в Российской Федерации" настоящим подтверждаю... | ||
Целью данной работы является изучение основных статистических методов анализа и интерпретации экспериментальных (случайных) данных... | Эта идея единства структур способностей послужила основой многих интеллектуально-профессиональных тестов, в частности, теста структуры... | ||
Эта идея единства структур способностей послужила основой многих интеллектуально-профессиональных тестов, в частности, теста структуры... | Методы в зависимости от типа социологических исследований подразделяются на качественные и количественные, а в зависимости от этапа... |
Поиск Главная страница   Заполнение бланков   Бланки   Договоры   Документы    |