Визуализация патента

Визуализация патентов — это приложение визуализации информации . Количество патентов увеличивается, [1] побуждая компании рассматривать интеллектуальную собственность как часть своей стратегии. [2] Визуализация патентов, как и картирование патентов , используется для быстрого просмотра патентного портфеля .

Программное обеспечение, предназначенное для визуализации патентов, начало появляться в 2000 году, например, Aureka от Aurigin (теперь принадлежит Thomson Reuters ). [3] Многие платформы для анализа патентов и портфелей, такие как Questel, [4] Patent Forecast, PatSnap, Patentcloud, Relecura и Patent iNSIGHT Pro, [5] предлагают возможности визуализации определенных данных в патентных документах путем создания тематических карт , [6] карт приоритетов, отчетов о ландшафте ИС, [7] и т. д. Программное обеспечение преобразует патенты в инфографику или карты, чтобы позволить аналитику «получить представление о данных» и сделать выводы. [8] Также называемая патинформатикой, [9] это «наука анализа патентной информации для обнаружения взаимосвязей и тенденций, которые было бы трудно увидеть при работе с патентными документами по принципу «один на один». [ необходима ссылка ]

Патенты содержат структурированные данные (например, номера публикаций) и неструктурированный текст (например, название, аннотация, претензии и визуальная информация). Структурированные данные обрабатываются с помощью интеллектуального анализа данных , а неструктурированные данные обрабатываются с помощью текстового анализа . [10]

Сбор данных

Основным шагом в обработке структурированной информации является интеллектуальный анализ данных [ 11] , который появился в конце 1980-х годов. Интеллектуальный анализ данных включает статистику, искусственный интеллект и машинное обучение [12] . Интеллектуальный анализ патентных данных извлекает информацию из структурированных данных патентного документа. [13] Эти структурированные данные представляют собой библиографические поля, такие как местоположение, дата или статус.

Структурированные поля

Структурированные данныеОписаниеИспользование бизнес-аналитики
ДанныеПатенты содержат идентификационные данные, включая приоритет, данные о публикации и дату выдачи.
  • Приоритетная перегруппировка данных, приоритетный номер, присвоенный первой заявке, соответствующая дата и приоритетная страна.
  • Данные о публикации включают номер публикации, присвоенный при публикации патента, через 18 месяцев после подачи заявки и дату публикации.
  • Дата выдачи — это дата выдачи патента, обычно через 3,5 года после подачи заявки в зависимости от патентного ведомства.
Пересечение полей дат и местоположений дает глобальное видение технологии во времени и пространстве.
ПравопреемникПатентообладателями являются организации или физические лица — владельцы патента.Поле может предложить рейтинг основных участников среды, что позволяет нам визуализировать потенциальных конкурентов или партнеров.
ИзобретательИзобретатели разрабатывают изобретение/патент.Сфера изобретателей в сочетании с областью правопреемников может создать социальную сеть и предоставить способ следить за экспертами в этой области.
КлассификацияКлассификация может перегруппировать изобретения со схожими технологиями. Наиболее часто используемой является Международная патентная классификация (МПК). Однако патентные организации имеют свою собственную классификацию; например, Европейское патентное ведомство разработало ECLA .Группировка патентов по темам дает обзор корпуса и потенциальных применений изучаемой технологии.
СтатусПравовой статус указывает на то, была ли заявка подана, одобрена или отклонена.Поиск патентного семейства и правового статуса важен для судебных разбирательств и конкурентной разведки.

Преимущества

Добыча данных позволяет изучать схемы подачи заявок конкурентами и находит основных патентных заявителей в определенной области технологий. Этот подход может быть полезен для мониторинга среды конкурентов, их действий и тенденций инноваций, а также дает макро-обзор состояния технологии. [ необходима цитата ]

Текст-майнинг

Принцип

Текстовый интеллектуальный анализ используется для поиска в неструктурированных текстовых документах. [14] [15] Этот метод широко используется в Интернете, он имел успех в биоинформатике , а теперь и в сфере интеллектуальной собственности. [16]

Текстовый интеллектуальный анализ основан на статистическом анализе повторяемости слов в корпусе. [17] Алгоритм извлекает слова и выражения из заголовка, резюме и претензий и собирает их по склонению . «И» и «если» помечаются как слова, не несущие информации, и сохраняются в списке стоп-слов . Списки стоп-слов могут быть специализированы для создания точного анализа. Затем алгоритм ранжирует слова по весу в соответствии с их частотой в корпусе патента и частотой документа, содержащего это слово. Оценка для каждого слова рассчитывается с использованием формулы, такой как: [18] [19]

Вт е я г час т = Т е г м   Ф г е д ты е н с у Д о с ты м е н т   Ф г е д ты е н с у = Ф г е д ты е н с у   о ф   т час е   ж о г г   о г   е х п г е с с я о н   я н   т час е   Т е х т   С е а Н ты м б е г   о ф   г о с ты м е н т с   с о н т а я н я н г   т час е   е х п г е с с я о н   о г   ж о г г {\displaystyle Вес={\frac {Частота\ Термина}{Частота\ Документа}}={\frac {Частота\ слова\ или\ выражения\ в\ текстовом\ море}{Количество\ документов\ содержащих\ выражение\ или\ слово}}}

Часто используемое слово в нескольких документах имеет меньший вес, чем слово, часто используемое в нескольких патентах. Слова с минимальным весом исключаются, оставляя список соответствующих слов или дескрипторов. Каждый патент связан с дескрипторами, найденными в выбранном документе. Далее, в процессе кластеризации, эти дескрипторы используются как подмножества, в которых патенты перегруппированы, или как теги для размещения патентов в предопределенных категориях, например, ключевые слова из Международной патентной классификации.

С помощью текстового анализа можно обрабатывать четыре части текста:

  • Заголовок
  • Абстрактный
  • Требовать
  • Полный текст патента

Программное обеспечение предлагает различные комбинации, но чаще всего используются заголовок, аннотация и формула изобретения, что обеспечивает хороший баланс между помехами и релевантностью.

Преимущества

Текстовый анализ может использоваться для сужения поиска или быстрой оценки корпуса патентов. Например, если запрос выдает нерелевантные документы, многоуровневая иерархия кластеризации идентифицирует их, чтобы удалить и уточнить поиск. Текстовый анализ также может использоваться для создания внутренних таксономий, специфичных для корпуса, для возможного сопоставления. [ необходима цитата ]

Визуализации

Объединение патентного анализа и информационных инструментов предлагает обзор окружающей среды посредством визуализаций с добавленной стоимостью. Поскольку патенты содержат структурированную и неструктурированную информацию, визуализации делятся на две категории. Структурированные данные могут быть визуализированы с помощью интеллектуального анализа данных на макротематике и статистическом анализе. Неструктурированную информацию можно отображать в виде облаков, кластерных карт и 2D-карт ключевых слов.

Визуализация интеллектуального анализа данных

ВизуализацияКартинаОписаниеИспользование бизнес-аналитики
Матричная диаграммаКартинаГрафический органайзер, используемый для обобщения многомерного набора данных в сетке.Сравнение данных
Карта местонахожденияКартинаКарта с наложенными значениями данных по географическим регионам
  • Пространственные модели
  • Найти инновационные юрисдикции
Столбчатая диаграммаКартинаГрафик с прямоугольными столбцами, пропорциональными значениям, которые они представляют, полезен для числовых сравнений.Эволюция данных
Линейный графикКартинаГрафик, используемый для обобщения взаимосвязи двух параметров и их изменения.Эволюция данных и взаимосвязи
Круговая диаграммаКартинаКруглая диаграмма, разделенная на секции для иллюстрации пропорций.Сравнение данных
Пузыристый графикКартина3-осевая 2D-диаграмма, которая обеспечивает визуализацию, аналогичную диаграмме магического квадранта .
  • Зрелость рынка
  • Конкурентный анализ
  • Возможности лицензирования

Визуализация интеллектуального анализа текста

ВизуализацияОписаниеИспользование бизнес-аналитики
Список деревьевСписок иерархии
  • Оценка релевантности
  • Таксономия
  • Концептуальные отношения
Облако теговПолный текст концепций. Размер каждого слова определяется его частотой в корпусе
  • Оценка релевантности
  • Более наглядно, чем список деревьев
2D карта ключевых слов [20]Томографическая карта с количественным представлением рельефа, обычно с использованием контурных линий и цветов. Расстояние на карте пропорционально разнице между темами. [13]
  • Ландшафтное видение тематики
  • Видение сходства с SOM
  • Мониторинг конкурентов
2D иерархическая карта кластера с количественным и качественным представлением ассоциации набора документов с темой, обычно с использованием квантованных ячеек и цветов. Размер ячеек темы может представлять количество патентов на тему относительно всего набора документов. Плотность и распределение внутри ячейки темы могут быть пропорциональны количеству документов относительно ассоциации с темой и силе ассоциации соответственно.
  • Ландшафтное видение тематики
  • Мониторинг конкурентов или технологического пространства
  • Выявление тенденций в определенном наборе патентов
Текст разбивается на логические группы и подгруппы, а затем представляется в виде удобной для навигации иерархии этих групп с помощью пропорциональных дуг окружностей.
  • Ландшафтное видение тематики
  • Мониторинг технологического пространства
  • Интерактивная навигация и детализация

Визуализация для анализа данных и текста

Картографические визуализации можно использовать для получения результатов как текстового, так и информационного анализа.

ВизуализацияКартинаОписаниеИспользование бизнес-аналитики
Карта деревьевКартинаВизуализация иерархических структур. Каждый элемент данных или строка в наборе данных представлена ​​прямоугольником, площадь которого пропорциональна выбранным параметрам.
  • Ландшафтное видение иерархической тематики
  • Позиция конкурентов или технологий по тематике
Карта сетиКартинаНа сетевой диаграмме сущности соединены друг с другом в виде диаграммы узлов и связей.
  • Видения отношений
  • Мониторинг аналогичных конкурентов или технологий
Карта цитированияКартинаНа карте цитирования дата цитирования отображается на оси x, а каждая отдельная цитата занимает запись на оси y. Сильная вертикальная линия указывает дату подачи заявки, показывая, какие цитаты цитируются патентом, а какие — ссылаются на патент.
  • Качественный и количественный обзор истории и плотности цитирования

Использует

Что может выделить патентная визуализация : [21] [22]

  • Конкуренты
  • Партнеры
  • Новые инновации
  • Описание технологической среды [23]
  • Сети

Применение в полевых условиях : [24] [22]

Ссылки

  1. ^ [1] [ мертвая ссылка ]
  2. Кевин Г. Риветт, Дэвид Клайн, «Открытие новой ценности в интеллектуальной собственности», Harvard Business Review (январь–февраль 2000 г.)
  3. ^ "Thomson Reuters | Aureka | Интеллектуальная собственность". Архивировано из оригинала 4 февраля 2013 года.
  4. ^ «Инструменты патентного анализа, картирования и визуализации — PIUG Space — Глобальный сайт».
  5. ^ "Patent iNSIGHT Pro". Архивировано из оригинала 2014-02-21 . Получено 2014-02-07 .
  6. ^ Провести анализ патентного портфеля с использованием сравнительных тематических карт.
  7. ^ Отчет о технологии графена
  8. ^ Дэниел А. Кейм и IEEE Computer Society, «Визуализация информации и визуальный анализ данных», IEEE TRANSACTIONS ON VISUALIZATION AND COMPUTER GRAPHICS 8 (2002): 1--8.
  9. ^ Энтони Дж. Трипп, «Патинформатика: от задач к инструментам», World Patent Information 25, № 3 (сентябрь 2003 г.): 211-221.
  10. ^ Лаура Руотсалайнен, «Инструменты интеллектуального анализа данных для технологий и конкурентной разведки» VTT Research Notes 2451 (октябрь 2008 г.)
  11. [2] Архивировано 12 июня 2010 г. на Wayback Machine.
  12. ^ «Как развивается интеллектуальный анализ данных».
  13. ^ Сонджу Ли, Бёнгун Юн и Ёнтэ Пак, «Подход к открытию новых технологических возможностей: подход к патентной карте на основе ключевых слов», Technovation 29, № 6 (Juin): 481-497.
  14. ^ [3] Архивировано 17 октября 2010 г. на Wayback Machine.
  15. ^ Бонино, Дарио; Чиарамелла, Альберто; Корно, Фульвио (2010). «Обзор современного состояния патентной информации и предстоящих разработок в области интеллектуальной патентной информатики». World Patent Information . 32 : 30–38. doi :10.1016/j.wpi.2009.05.008.
  16. ^ Шолом Вайс и др., Анализ текста: прогностические методы анализа неструктурированной информации, 1-е изд. (Springer 2004).
  17. ^ Антуан Бланшар "La cartographie des brevets" La Recherche n°.398 (2006): 82-83
  18. ^ Джерард Солтон и Кристофер Бакли, «Подходы к взвешиванию терминов при автоматическом поиске текста», Обработка информации и управление 24, № 5 (1988): 513-523.
  19. ^ Y Kim, J Suh и S Park, «Визуализация патентного анализа для новых технологий», Expert Systems with Applications 34, № 3 (4, 2008): 1804–1812.
  20. ^ "Newsmap". Архивировано из оригинала 8 июля 2010 г. Получено 28 апреля 2017 г.
  21. ^ Мияке, М., Муне, Й. и Химено, К. «Стратегическое управление портфелем интеллектуальной собственности: оценка технологий с использованием «технологической тепловой карты»», Документы Исследовательского института Номура (NRI), № 83 (декабрь 2004 г.).
  22. ^ ab Чарльз Булакиа "Патентное картирование" Архивировано 13.03.2011 на Wayback Machine
  23. ^ Ричард Сеймур, «Анализ и картирование патентов на металлы платиновой группы», Platinum Metals Review 52, ​​№ 4 (10, 2008): 231-240.
  24. ^ Сьюзан Э. Каллен, «Введение. От желудей до дубов: как патентные аудиты помогают инновациям раскрыть весь свой потенциал» Стоимость интеллектуальной собственности 2010 г. — Международное руководство для зала заседаний: 26–30
Взято с "https://en.wikipedia.org/w/index.php?title=Patent_visualisation&oldid=1241678163"