WikiDer > Arnetminer
ArnetMiner (также AMiner) - это бесплатный онлайн-сервис, используемый для индексации, поиска и добычи больших научных данных.
Обзор
ArnetMiner (AMiner) предназначен для поиска и выполнения сбор данных операции против научных публикаций в Интернете с использованием анализа социальных сетей для выявления связей между исследователями, конференциями и публикациями.[1] Это позволяет ему предоставлять такие услуги, как поиск экспертов, географический поиск, анализ тенденций, рекомендации рецензентов, поиск ассоциаций, поиск курсов, оценка успеваемости и моделирование тем.
ArnetMiner был создан как исследовательский проект в области анализа социального влияния, ранжирования социальных сетей и извлечения социальных сетей. По результатам разработки системы был опубликован ряд рецензируемых статей. Он действует более трех лет и проиндексировал 130 000 000 исследователей и более 200 миллионов публикаций.[2] Исследование финансировалось Китайской национальной программой исследований и разработок в области высоких технологий и Национальный научный фонд Китая.
ArnetMiner обычно используется в академических кругах для определения взаимосвязей и статистических корреляций между исследованиями и исследователями. Он привлек более 10 миллионов независимых IP-доступов из 220 стран и регионов. Продукт использовался в Эльзевирплатформа SciVerse,[3] и научные конференции, такие как SIGKDD, ICDM, PKDD, WSDM.
Операция
ArnetMiner автоматически извлекает профиль исследователя из Интернета. Он собирает и идентифицирует соответствующие страницы, а затем использует единый подход для извлечения данных из идентифицированных документов. Он также извлекает публикации из электронных электронных библиотек с помощью эвристических правил.
Он объединяет извлеченные профили исследователей и извлеченные публикации. В качестве идентификатора используется имя исследователя. Была предложена вероятностная структура для решения проблемы неоднозначности имени при интеграции. Интегрированные данные хранятся в базе знаний исследовательской сети (RNKB).
Другими основными продуктами в этой области являются Google Scholar, Elsevier's Scirus и проект с открытым исходным кодом CiteSeer.
История
Его инициировал и создал профессор Джи Тан из Университет Цинхуа, Китай. Впервые он был запущен в марте 2006 года. Ниже приводится список обновлений за последние годы:
- Март 2006 г., версия 0.1. Функции включают профилирование исследователя, поиск экспертов, поиск по конференциям и поиск публикаций. Система разработана на Perl;
- Август 2006 г., версия 1.0, система была повторно реализована на Java;
- Июль 2007 г., версия 2.0. Новые функции включают анализ интересов исследователей, поиск по ассоциациям, поиск статей для опросов (сейчас недоступно);
- Апрель 2008 г., версия 3.0, новые функции включают понимание запроса, новый графический интерфейс и анализ журнала поиска;
- Ноябрь 2008 г., версия 4.0. Новые функции включают поиск по графам, моделирование тем, извлечение информации о финансировании NSF / NSFC;
- Апрель 2009 г., версия 5.0, новые функции включают редакцию профиля, открытый API-сервис, поиск по Bole, поиск курса (сейчас недоступен);
- Декабрь 2009 г., версия 6.0, новые функции включают оценку успеваемости, отзывы пользователей, анализ конференций;
- Май 2010 г., версия 7.0, новые функции включают устранение неоднозначности имени, рекомендацию рецензента статьи, создание ArnetPage;
- Март 2012 года, версия II, переименованная в AMiner, переписала все коды и переработала графический интерфейс. Новые функции: географический поиск, платформа ArnetAPP.
- Июнь 2014 г., версия II, переименованная в AMiner, переписала все коды и переработала графический интерфейс. Новые функции: географический поиск, платформа ArnetAPP.
- В декабре 2015 года в сети появилась совершенно новая версия.
- В мае 2017 года появилась профессиональная версия.
- Апрель 2018 г., новые функции включают анализ тенденций,[4] устранение неоднозначности имен на основе глубокого обучения[5]
Ресурсы
ArnetMiner опубликовал несколько наборов данных для академических исследований, в том числе Open Academic Graph,[6] DBLP + цитирование[7] (набор данных, дополняющих цитаты в данных DBLP из Электронная библиография и библиотечный проект), Устранение неоднозначности имени,[8] Анализ социальных связей.[9] Для получения дополнительных наборов данных и исходных кодов для исследований, пожалуйста, обратитесь к.[10]
Смотрите также
- CiteSeerX
- Электронная библиография и библиотечный проект
- Google ученый
- Microsoft Academic Search
- Список академических баз данных и поисковых систем
- Scirus
- Scopus
Рекомендации
- ^ Цзе Тан; Цзин Чжан; Лимин Яо; Хуанзи Ли; Ли Чжан; Чжун Су (2008). «ArnetMiner: добыча и майнинг академических социальных сетей». Материалы 14-й Международной конференции ACM SIGKDD по открытию знаний и интеллектуальному анализу данных. Нью-Йорк: ACM.
- ^ «Arnetminer: введение». Получено 28 мая 2010.
- ^ "SciVerse - HUB - Главная". Архивировано из оригинал 9 сентября 2012 г.. Получено 24 апреля 2012.
- ^ "Анализ тренда". Получено 24 декабря 2018.
- ^ Ютао Чжан; Fanjin Zhang; Пейран Яо; Цзе Тан (2018). «Устранение неоднозначности имен в AMiner: кластеризация, обслуживание и человек в цикле». Материалы 24-й Международной конференции ACM SIGKDD по открытию знаний и интеллектуальному анализу данных. Лондон: ACM.
- ^ «Открытый академический граф». Получено 24 декабря 2018.
- ^ "Документы DBLP + Цитирование". Получено 24 декабря 2018.
- ^ "Устранение неоднозначности имени". Получено 24 апреля 2012.
- ^ «Вывод социальных связей в больших сетях». Получено 24 апреля 2012.
- ^ «Открытые данные и коды от ArnetMiner». Получено 24 апреля 2012.
внешняя ссылка
дальнейшее чтение
- Цзе Тан, Цзин Чжан, Лиминь Яо, Хуанзи Ли, Ли Чжан, Чжун Су. Arnetminer: добыча и майнинг академических социальных сетей. В материалах 14-й международной конференции ACM SIGKDD по обнаружению знаний и интеллектуальному анализу данных (SIGKDD'2008)
- Чи Ван, Цзявэй ХанЮньтао Цзя, Джи Тан, Дуо Чжан, Иньтао Ю и Цзинъи Го. Отношения советника по горному делу-консультант из исследовательских издательских сетей. Материалы шестнадцатой Международной конференции ACM SIGKDD по открытию знаний и интеллектуальному анализу данных (SIGKDD'2010).
- Джи Тан, Цзимэн Сунь, Чи Ван и Цзы Ян. Анализ социального влияния в крупномасштабных сетях. В материалах пятнадцатой Международной конференции ACM SIGKDD по открытию знаний и интеллектуальному анализу данных (SIGKDD'2009). С. 807–816.
- Джи Тан, Жуомин Цзинь и Цзин Чжан. Подход к тематическому моделированию и его интеграция в структуру случайного блуждания для академического поиска. В материалах Международной конференции IEEE 2008 г. по интеллектуальному анализу данных (ICDM'2008). С. 1055–1060.
- Джи Тан, Лиминь Яо, Дуо Чжан и Цзин Чжан. Комбинированный подход к профилированию веб-пользователей. Транзакции ACM при обнаружении знаний из данных (TKDD), (том 5, № 1), статья 2 (декабрь 2010 г.), 44 страницы.
- Ютао Чжан, Фаньцзинь Чжан, Пейран Яо и Джи Тан. Устранение неоднозначности имен в AMiner: кластеризация, обслуживание и человек в цикле. В материалах Двадцать четвертой Международной конференции ACM SIGKDD по открытию знаний и интеллектуальному анализу данных (KDD'18). С. 1002-1011.