Обсуждение:Семантический ученый

Классификация цитирований

Бьянка Крамер отмечает, что Semantic Scholar «показывает, ссылается ли цитата на методы, результаты или предысторию». Я считаю, что это стоит упомянуть, позже поищу вторичный источник. Nemo 07:01, 25 октября 2019 (UTC) [ ответить ]

«Взаимодействие человека с компьютером» с заглавной буквы

Небольшое замечание: есть ли причина, по которой я пропускаю заглавные буквы «H» и «C» (строчные в статье « Взаимодействие человека с компьютером» )? Лучшее, -- Marsupium ( обсуждение ) 23:45, 23 декабря 2021 (UTC) [ ответить ]

Вводящий в заблуждение текст: «Не ищет материалы за платным доступом»

Текущий текст выглядит так: «Semantic Scholar бесплатен в использовании и, в отличие от аналогичных поисковых систем (например, Google Scholar), не ищет материалы, доступ к которым платный. [необходима ссылка]», что подразумевает, что он предоставляет только результаты, доступ к которым не платный, хотя на самом деле означает: «он не ищет материалы, доступ к которым платный».

Хотелось бы, чтобы кто-нибудь (с хорошим знанием английского!) прояснил ситуацию, чтобы избежать недоразумений. Kouroshkoratamadia ( talk ) 11:53, 27 декабря 2023 (UTC) [ ответить ]

Да, это явно неверно. Это легко проверить, просто выполнив поиск любой статьи, опубликованной в журнале с закрытым доступом, и посмотрев, появится ли она. Однако текущая цитата использует формулировку «за платным доступом» без пояснения ее значения, поэтому я думаю, что для ее изменения потребуется другой уточняющий источник? Joshisanonymous ( talk ) 16:50, 20 апреля 2024 (UTC) [ ответить ]
Он не позволяет никому ссылаться на статьи, которые не находятся в свободном доступе в сети; он распознает только статьи, которые находятся в свободном доступе. FrankieItalo (обсуждение) 01:11, 6 мая 2024 (UTC) [ ответить ]
Ping Kouroshkoratamadia и Joshisanonymous. Вы правы. Источник, который цитируется выше и находится в статье WP, неверен.
  • Semantic Scholar (SS) можно использовать бесплатно
  • SS ищет и извлекает информацию из статей в свободном доступе в онлайн-журналах
  • Однако SS ТАКЖЕ ищет материалы за платным доступом! Другими словами, Semantic Scholar может (и делает это) получить доступ ко многим статьям, которые не опубликованы в научных журналах с открытым доступом.
Описания SS очень обманчивы! Даже Исследовательская библиотека Министерства торговли США, LITERATURE SEARCH: SEMANTIC SCHOLAR ошибается: «[SS] не ищет материалы, которые находятся за платным доступом».
Я нашел 3 объяснения того, как работает Semantic Scholar (SS) в отношении платного доступа.
ONE Из раздела FAQ SS, Контент Q1. Откуда Semantic Scholar получает статьи? A1. "Semantic Scholar получает свой контент через веб-индексацию и из партнерских отношений с научными журналами... Вы можете найти список наших источников, посетив страницу наших партнеров-издателей ... Мы индексируем контент из PubMed, arXiv, Springer Nature и других".
В2. Как получить доступ к полному тексту статьи? О2. "...вы найдете параметры доступа под аннотацией статьи, расположенной на странице сведений о статье... вы увидите параметры "Просмотреть PDF", "Просмотреть статью" или "Просмотреть через издателя", которые перенаправят вас на полный текст PDF... Если статья не находится в свободном доступе, на веб-сайте издателя есть варианты ее приобретения . Для получения дополнительной информации см. раздел "Как получить доступ к PDF-файлу, используя мою институциональную принадлежность?"
Это ничем не отличается от Google Scholar или любого другого хранилища исследовательских работ с журналами, доступ к которым возможен только по подписке.
TWO В A1 выше, партнеры-издатели ссылаются здесь: https://www.semanticscholar.org/about/publishers University of Chicago Press указан. Вот как U Chicago Press описывает свое партнерство с SS, выделено мной: "Статьи, опубликованные в журналах University of Chicago Press, теперь будут появляться в корпусе Semantic Scholar, предоставляя читателям библиографическую информацию и резюме статей. Каждая статья ссылается непосредственно на веб-страницу журнала, поэтому подписчики могут прочитать полный текст или загрузить PDF-файл ".
Итак, если SS ссылается на статью в журнале открытого доступа, вы можете прочитать ее или скачать. Все остальные цитирования статей, возвращаемые SS, являются платными .
THREE В материалах 58-го ежегодного собрания Ассоциации компьютерной лингвистики (2020) эта статья запускает поиск цитирования только по статьям с открытым доступом, S2ORC: The Semantic Scholar Open Research Corpus (pdf). На стр. 4570 «Статьи в SS получены из многочисленных источников: получены напрямую от издателей... из arXiv или PubMed, или просканированы из открытого Интернета». Это означает, что большинство статей, которые получает SS, поступают напрямую от издателей и не находятся в открытом доступе. S2ORC состоит из всех статей в корпусе Semantic Scholar, которые написаны на английском языке, имеют аннотации и находятся в открытом доступе. Полный корпус SS составляет примерно 300 млн журнальных статей. Некоторая фильтрация выполняется, чтобы получить 81,1 млн статей.
См. стр. 4972–4973 и таблицу 3. «Охват аннотаций, предоставленных нашим издателем, составляет 90,4%, или 73,4 млн статей. Охват PDF-файлов составляет 35,6%, или 28,9 млн статей... мы извлекаем библиографические записи для 27,6 млн из 28,9 млн PDF-файлов. Мы идентифицируем 8,1 млн из 28,9 млн PDF-файлов как находящиеся в открытом доступе, и предоставляем полный текст для всех статей в этом подмножестве открытого доступа. Используя эти извлеченные библиографии, мы разрешаем в общей сложности 380,5 млн ссылок цитирования между статьями...»
Только 10% из 81 миллиона статей в отобранном подмножестве являются PDF-файлами открытого доступа! -- FeralOink ( обсуждение ) 23:04, 10 июля 2024 (UTC) [ ответить ]

неверные анализы

С его классификациями есть серьезные проблемы. Он использует только однобуквенные инициалы и, следовательно, смешивает все виды полей для общих имен. Он сваливает все на иностранном языке вместе без анализа; ему нужно анализировать иностранные языки, а также английский. Он не позволяет ученым исправлять ошибки — например, он перечисляет обзоры как статьи под автором(ами) рецензируемой книги, что совершенно неуместно. Он также произвольно разделяет разделы работ одного автора по тому, что, по его мнению, является предметом, и не позволяет объединять страницы соответствующего автора. FrankieItalo (обсуждение) 01:15, 6 мая 2024 (UTC) [ ответить ]

SS (S2?) кажется бесполезным. Интересно, почему Институт ИИ Пола Аллена выпустил его, учитывая проблемы с качеством данных, которые вы описали! Они работали над SS с 2017 года или раньше. Я его не читал, но эта статья может касаться путаницы с именами, которую вы упомянули, S2AND: Система оценки и анализа для устранения неоднозначности имени автора.
Проблемы с неанглийскими именами (и, вероятно, всем, что использует кириллицу) напоминают мне списки OFAC и FinCEN , с которыми я работал. Я работаю/работал в сфере управления банковскими рисками, и я не мог поверить, насколько дорогими и подверженными ошибкам были некоторые «услуги» по санкционным решениям! Так много ложных отрицательных результатов из-за первых трех предложений того, что вы написали. Пол Аллен и BERT AI должны были бы работать намного лучше.
Я заметил в FAQ SS, что ученым трудно или невозможно исправить фактические ошибки в ссылках на свои работы, что просто смешно. -- FeralOink ( обсуждение ) 23:35, 10 июля 2024 (UTC) [ ответ ]

Проблема с S2CID

На странице https://en.wikipedia.org/wiki/Semantic_Scholar#S2CID при использовании примера |s2cid=211099356 в ссылке

Лю, Ин; Гейл, Альберт А; Уайлдер-Смит, Аннелис; Роклов, Йоаким (март 2020 г.). «Репродуктивное число COVID-19 выше по сравнению с коронавирусом SARS». Журнал медицины путешествий . 27 (2). doi : 10.1093/jtm/taaa021. PMID  32052846. S2CID  211099356.

,

неверный результат. Кажется, S2CID не работает. Федосин ( обсуждение ) 05:14, 2 ноября 2024 (UTC) [ ответить ]

Retrieved from "https://en.wikipedia.org/w/index.php?title=Talk:Semantic_Scholar&oldid=1254890062"