Кристаллографическая база данных — это база данных, специально разработанная для хранения информации о структуре молекул и кристаллов . Кристаллы — это твердые тела , имеющие во всех трех измерениях пространства регулярно повторяющееся расположение атомов , ионов или молекул . Они характеризуются симметрией , морфологией и зависящими от направления физическими свойствами. Кристаллическая структура описывает расположение атомов, ионов или молекул в кристалле. (Молекулы должны кристаллизоваться в твердые тела, чтобы их регулярно повторяющееся расположение можно было использовать в кристаллографии, основанной на рентгеновской , нейтронной и электронной дифракции ).
Кристаллические структуры кристаллического материала обычно определяются из данных рентгеновской или нейтронной дифракции монокристалла и сохраняются в базах данных кристаллической структуры. Они обычно идентифицируются путем сравнения интенсивности отражения и расстояния между решетками из данных рентгеновской порошковой дифракции с записями в базах данных порошковой дифракции .
Кристаллические структуры кристаллических образцов нанометрового размера могут быть определены с помощью информации об амплитуде структурного фактора из данных электронной дифракции монокристалла или информации об амплитуде структурного фактора и фазовом угле из преобразований Фурье изображений кристаллитов , полученных с помощью HRTEM . Они хранятся в базах данных кристаллических структур, специализирующихся на нанокристаллах, и могут быть идентифицированы путем сравнения подмножеств осей зон в графиках отпечатков решеточных полос с записями в базе данных отпечатков решеточных полос.
Кристаллографические базы данных различаются по правам доступа и использования и предлагают различные уровни поиска и анализа. Многие предоставляют возможности визуализации структуры. Они могут быть основаны на браузере или установлены локально. Более новые версии построены на модели реляционной базы данных и поддерживают файл кристаллографической информации ( CIF ) как универсальный формат обмена данными.
Кристаллографические данные в основном извлекаются из опубликованных научных статей и дополнительных материалов. Новые версии кристаллографических баз данных построены на реляционной модели базы данных, которая позволяет эффективно использовать перекрестные ссылки таблиц. Перекрестные ссылки служат для получения дополнительных данных или улучшения поисковой емкости базы данных.
Обмен данными между кристаллографическими базами данных, программами визуализации структур и программами уточнения структур был облегчен с появлением формата файла кристаллографической информации (CIF). Формат CIF является стандартным форматом файла для обмена и архивирования кристаллографических данных. [1] Он был принят Международным союзом кристаллографии ( IUCr ), который также предоставляет полные спецификации формата. [2] Он поддерживается всеми основными кристаллографическими базами данных.
Растущая автоматизация процесса определения кристаллической структуры привела к все более высоким показателям публикации новых кристаллических структур и, как следствие, новых моделей публикации. Минималистичные статьи содержат только таблицы кристаллических структур, структурные изображения и, возможно, абстрактное описание структуры. Они, как правило, публикуются в финансируемых авторами или субсидируемых журналах открытого доступа . Acta Crystallographica Section E и Zeitschrift für Kristallographie относятся к этой категории. Более сложные статьи могут быть отправлены в традиционные журналы, финансируемые подписчиками. Гибридные журналы, с другой стороны, встраивают отдельные финансируемые авторами статьи открытого доступа среди финансируемых подписчиками. Издатели также могут делать научные статьи доступными онлайн, в виде файлов Portable Document Format ( PDF ).
Данные о кристаллической структуре в формате CIF связаны с научными статьями как дополнительный материал. CIF могут быть доступны непосредственно с веб-сайта издателя, из кристаллографических баз данных или из обоих. В последние годы многие издатели кристаллографических журналов стали интерпретировать CIF как форматированные версии открытых данных , т. е. представляющие не защищенные авторским правом факты, и поэтому стремятся сделать их свободно доступными в сети, независимо от статуса доступности связанных научных статей.
По состоянию на 2008 год было опубликовано и сохранено в базах данных по кристаллическим структурам более 700 000 кристаллических структур . Скорость публикации достигла более 50 000 кристаллических структур в год. Эти цифры относятся к опубликованным и переизданным кристаллическим структурам из экспериментальных данных. Кристаллические структуры переиздаются из-за исправлений ошибок симметрии , улучшений параметров решетки и атомов , а также различий в технике дифракции или экспериментальных условиях. По состоянию на 2016 год известно и опубликовано около 1 000 000 молекулярных и кристаллических структур, примерно половина из них находится в открытом доступе .
Кристаллические структуры обычно классифицируются как минералы , металлы - сплавы , [4] неорганические , [5] органические , [6] нуклеиновые кислоты , [7] и биологические макромолекулы . [8] [9] Отдельные базы данных кристаллических структур обслуживают пользователей в определенных химических , молекулярно-биологических или смежных дисциплинах, охватывая супер- или подмножества этих категорий. Минералы являются подмножеством в основном неорганических соединений . Категория «металлы-сплавы» охватывает металлы, сплавы и интерметаллиды . Металлы-сплавы и неорганические вещества могут быть объединены в «неорганические». Органические соединения и биологические макромолекулы разделяются в соответствии с размером молекул. Органические соли, металлоорганические соединения и металлопротеины, как правило, относят к органическим или биологическим макромолекулам соответственно. Нуклеиновые кислоты являются подмножеством биологических макромолекул.
Полнота может относиться к числу записей в базе данных. В этих терминах база данных кристаллических структур может считаться полной, если она содержит коллекцию всех (повторно) опубликованных кристаллических структур в интересующей категории и часто обновляется. Поиск структур в такой базе данных может заменить более трудоемкий просмотр открытой литературы. Доступ к базам данных кристаллических структур сильно различается. Его можно разделить на доступ для чтения и доступ для записи. Права доступа для чтения (поиск, загрузка) влияют на количество и круг пользователей. Ограниченный доступ для чтения часто сочетается с ограниченными правами использования. Права доступа для записи (загрузка, редактирование, удаление), с другой стороны, определяют количество и круг участников базы данных. Ограниченный доступ для записи часто сочетается с высокой целостностью данных .
С точки зрения количества пользователей и ежедневного доступа, всеобъемлющие и тщательно проверенные базы данных кристаллической структуры открытого доступа , естественно, превосходят сопоставимые базы данных с более ограниченными правами доступа и использования. Независимо от полноты, базы данных кристаллической структуры открытого доступа породили проекты программного обеспечения с открытым исходным кодом , такие как инструменты анализа поиска, программное обеспечение для визуализации и производные базы данных. Научный прогресс был замедлен из-за ограничения прав доступа или использования, а также ограничения полноты или целостности данных. Ограниченные права доступа или использования обычно связаны с коммерческими базами данных кристаллической структуры. Отсутствие полноты или целостности данных, с другой стороны, связано с некоторыми базами данных кристаллической структуры открытого доступа, отличными от Crystallography Open Database (COD), [10] [11] и является «макромолекулярным аналогом открытого доступа», всемирной базой данных белков. Помимо этого, несколько баз данных кристаллической структуры находятся в свободном доступе в первую очередь для образовательных целей, в частности, минералогические базы данных и образовательные ответвления COD.
Кристаллографические базы данных могут специализироваться на кристаллических структурах, идентификации кристаллических фаз, кристаллизации , [12] морфологии кристаллов или различных физических свойствах. Более интегративные базы данных объединяют несколько категорий соединений или специализаций. [13] Структуры несоразмерных фаз, 2D-материалы , [14] нанокристаллы, тонкие пленки на подложках , [15] и предсказанные кристаллические структуры собираются в специализированных базах данных структур.
Возможности поиска кристаллографических баз данных сильно различаются. Базовая функциональность включает поиск по ключевым словам, физическим свойствам и химическим элементам . Особое значение имеет поиск по названию соединения и параметрам решетки . Очень полезны параметры поиска, которые позволяют использовать подстановочные знаки и логические связки в строках поиска. Если поддерживается, область поиска может быть ограничена исключением определенных химических элементов.
Более сложные алгоритмы зависят от типа исследуемого материала. Органические соединения могут быть найдены на основе определенных молекулярных фрагментов. Неорганические соединения , с другой стороны, могут представлять интерес в отношении определенного типа координационной геометрии . Более продвинутые алгоритмы имеют дело с конформационным анализом (органика), супрамолекулярной химией (органика), межполиэдральной связностью («неорганика») и молекулярными структурами более высокого порядка ( биологические макромолекулы ). Алгоритмы поиска, используемые для более сложного анализа физических свойств, например, фазовых переходов или взаимосвязей структура-свойство, могут применять групповые теоретические концепции.
Современные версии кристаллографических баз данных основаны на реляционной модели базы данных. Связь с базой данных обычно происходит через диалект языка структурированных запросов ( SQL ). Веб-базы данных обычно обрабатывают алгоритм поиска на сервере, интерпретируя поддерживаемые элементы скриптов , в то время как настольные базы данных запускают локально установленные и обычно предварительно скомпилированные поисковые системы .
Кристаллический материал можно разделить на монокристаллы , двойные кристаллы , поликристаллы и кристаллический порошок . В монокристалле расположение атомов , ионов или молекул определяется монокристаллической структурой в одной ориентации. Двойные кристаллы, с другой стороны, состоят из монокристаллических двойных доменов , которые выровнены по законам двойников и разделены доменными стенками .
Поликристаллы состоят из большого количества небольших отдельных кристаллов, или кристаллитов , удерживаемых вместе тонкими слоями аморфного твердого тела . Кристаллический порошок получается путем измельчения кристаллов, в результате чего образуются частицы порошка, состоящие из одного или нескольких кристаллитов. Как поликристаллы, так и кристаллический порошок состоят из множества кристаллитов с различной ориентацией.
Кристаллические фазы определяются как области с одинаковой кристаллической структурой, независимо от ориентации или двойникования . Таким образом, одиночные и двойниковые кристаллические образцы представляют собой отдельные кристаллические фазы. Поликристаллические или кристаллические порошковые образцы могут состоять из более чем одной кристаллической фазы. Такая фаза включает все кристаллиты в образце с одинаковой кристаллической структурой.
Кристаллические фазы могут быть идентифицированы путем успешного сопоставления подходящих кристаллографических параметров с их аналогами в записях базы данных. Предварительные знания о химическом составе кристаллической фазы могут быть использованы для сокращения количества записей базы данных до небольшого выбора структур-кандидатов и, таким образом, значительного упрощения процесса идентификации кристаллической фазы.
Применение стандартных методов дифракции к кристаллическим порошкам или поликристаллам равносильно сжатию обратного трехмерного пространства , полученного с помощью дифракции монокристалла , на ось 1D. Получающееся частичное или полное перекрытие независимых от симметрии отражений делает процесс определения структуры более сложным, если не невозможным.
Данные порошковой дифракции могут быть представлены в виде зависимости интенсивности дифракции ( I ) от обратного шага решетки (1/ d ). Положения отражения и интенсивности известных кристаллических фаз, в основном из данных рентгеновской дифракции , хранятся в виде пар данных d - I в базе данных Powder Diffraction File ( PDF ). Список пар данных d - I является весьма характерным для кристаллической фазы и, таким образом, подходит для идентификации, также называемой «отпечатками пальцев», кристаллических фаз. [16]
Алгоритмы поиска-соответствия сравнивают выбранные тестовые отражения неизвестной кристаллической фазы с записями в базе данных . Алгоритмы, основанные на интенсивности, используют три наиболее интенсивные линии (так называемый «поиск Ханаволта»), в то время как алгоритмы, основанные на d -расстоянии, основаны на восьми-десяти самых больших d -расстояниях (так называемый «поиск Финка»). [17]
Метод рентгеновской порошковой дифракции стал стандартным инструментом для идентификации отдельных или множественных кристаллических фаз и широко используется в таких областях, как металлургия , минералогия , судебная экспертиза , археология , физика конденсированных сред , а также биологические и фармацевтические науки .
Порошковые дифракционные картины очень маленьких монокристаллов, или кристаллитов , подвержены уширению пиков, зависящему от размера, что ниже определенного размера делает порошковую дифракционную дактилоскопию бесполезной. В этом случае разрешение пиков возможно только в обратном трехмерном пространстве , т. е. путем применения методов дифракции электронов на монокристаллах .
Просвечивающая электронная микроскопия высокого разрешения ( HRTEM ) обеспечивает получение изображений и дифракционных картин кристаллитов нанометрового размера. Фурье-преобразования изображений HRTEM и электронных дифракционных картин предоставляют информацию о проецируемой геометрии обратной решетки для определенной ориентации кристалла, где ось проекции совпадает с оптической осью микроскопа.
Проецируемые геометрии решетки могут быть представлены так называемыми «диаграммами отпечатков решеточных полос» (LFFP), также называемыми диаграммами угловой ковариации. [18] Горизонтальная ось такого графика задается в обратной длине решетки и ограничена точечным разрешением микроскопа. Вертикальная ось определяется как острый угол между преобразованными Фурье решеточными полосами или пятнами электронной дифракции. Двумерная точка данных определяется длиной вектора обратной решетки и ее (острым) углом с другим вектором обратной решетки. Наборы двумерных точек данных, которые подчиняются зонному закону Вейсса, являются подмножествами всех точек данных в LFFP. Поэтому подходящий алгоритм поиска-соответствия, использующий LFFP, пытается найти соответствующие подмножества осей зон в базе данных . Это, по сути, вариант алгоритма сопоставления решеток. [19]
В случае электронных дифракционных картин амплитуды структурных факторов могут быть использованы на более позднем этапе для дальнейшего различения среди выбранных структур-кандидатов (так называемое «отпечатки структурных факторов»). Амплитуды структурных факторов из данных электронной дифракции гораздо менее надежны, чем их аналоги из данных рентгеновской монокристаллической и порошковой дифракции. Существующие методы прецессионной электронной дифракции значительно улучшают качество амплитуд структурных факторов, увеличивают их количество и, таким образом, делают информацию об амплитудах структурных факторов гораздо более полезной для процесса отпечатков. [20]
С другой стороны, преобразования Фурье изображений HRTEM предоставляют информацию не только о проецируемой геометрии обратной решетки и амплитудах структурного фактора, но и о фазовых углах структурного фактора. После кристаллографической обработки изображений [21] фазовые углы структурного фактора гораздо более надежны, чем амплитуды структурного фактора. Дальнейшее различение структур-кандидатов затем в основном основано на фазовых углах структурного фактора и, в меньшей степени, на амплитудах структурного фактора (так называемое «отпечатки структурного фактора»). [22] [23]
Обобщенный закон Стено [24] гласит, что углы между идентичными гранями любого монокристалла одного и того же материала по своей природе ограничены одним и тем же значением. [25] Это дает возможность давать отпечатки пальцев кристаллических материалов на основе оптической гониометрии , которая также известна как кристаллометрия. [26] Для успешного использования этой техники необходимо учитывать наблюдаемую симметрию точечной группы измеренных граней и творчески применять правило, согласно которому « кристаллические морфологии часто представляют собой комбинации простых (т.е. с низкой кратностью) форм, где отдельные грани имеют наименьшие возможные индексы Миллера для любой заданной оси зоны ». Это должно гарантировать, что для любого монокристалла будет получена правильная индексация граней кристалла.
Во многих случаях возможно вывести соотношения кристаллических осей для кристаллов с низкой симметрией из оптической гониометрии с высокой точностью и достоверностью и идентифицировать кристаллический материал только на их основе, используя такие базы данных, как «Crystal Data». [27] При условии, что грани кристалла были правильно проиндексированы и углы сопряжения были измерены с точностью, превышающей несколько долей десятых градуса, кристаллический материал может быть идентифицирован совершенно однозначно на основе сравнений углов с двумя довольно обширными базами данных : «Bestimmungstabellen für Kristalle (Определитель кристаллов)» [28] и «Barker Index of Crystals» [29] .
Поскольку закон Стено может быть дополнительно обобщен для отдельного кристалла любого материала, чтобы включить углы либо между всеми одинаково проиндексированными сетчатыми плоскостями (т. е. векторами обратной решетки , также известными как «потенциальные отражения в дифракционных экспериментах»), либо между всеми одинаково проиндексированными направлениями решетки (т. е. векторами прямой решетки, также известными как оси зон), существуют возможности для морфологического отпечатка нанокристаллов в просвечивающем электронном микроскопе ( ПЭМ ) с помощью просвечивающей электронной гониометрии. [30]
Гониометр образца ТЭМ, таким образом, используется аналогично головке гониометра оптического гониометра. Оптическая ось ТЭМ тогда аналогична опорному направлению оптического гониометра. В то время как в оптической гониометрии нормали плоскости сетки (векторы обратной решетки) должны быть последовательно выровнены параллельно опорному направлению оптического гониометра для получения измерений углов интерфейса, соответствующее выравнивание необходимо выполнить для осей зоны (прямой вектор решетки) в просвечивающей электронной гониометрии. (Обратите внимание, что такие выравнивания по своей природе довольно тривиальны для нанокристаллов в ТЭМ после того, как микроскоп был выровнен стандартными процедурами.)
Поскольку трансмиссионная электронная гониометрия основана на законе Брэгга для случая пропускания (Лауэ) (дифракции электронных волн), межзональные углы (т. е. углы между направлениями решетки) могут быть измерены с помощью процедуры, аналогичной измерению интерфейсных углов в оптическом гониометре на основе закона Снеллиуса , т. е. отражения света. С другой стороны, дополнения к интерфейсным углам внешних граней кристалла могут быть напрямую измерены из картины дифракции зона-ось или из Фурье-преобразования изображения TEM высокого разрешения, которое показывает скрещенные полосы решетки.
Параметры решетки неизвестных кристаллических фаз могут быть получены из данных рентгеновской , нейтронной или электронной дифракции . Эксперименты по дифракции монокристаллов предоставляют матрицы ориентации, из которых можно вывести параметры решетки. В качестве альтернативы параметры решетки могут быть получены из данных дифракции порошка или поликристалла с помощью подгонки профиля без структурной модели (так называемый «метод Ле Бейля»).
Произвольно определенные элементарные ячейки могут быть преобразованы в стандартную настройку и оттуда далее сведены к примитивной наименьшей ячейке. Сложные алгоритмы сравнивают такие сокращенные ячейки с соответствующими записями базы данных . Более мощные алгоритмы также рассматривают производные супер- и подячейки. Процесс сопоставления решеток может быть еще более ускорен путем предварительного вычисления и сохранения сокращенных ячеек для всех записей. Алгоритм ищет совпадения в определенном диапазоне параметров решетки. Более точные параметры решетки допускают более узкий диапазон и, таким образом, лучшее соответствие. [31]
Сопоставление решеток полезно для идентификации кристаллических фаз на ранних стадиях экспериментов по дифракции монокристаллов и, таким образом, избегая ненужных процедур полного сбора данных и определения структуры для уже известных кристаллических структур. Этот метод особенно важен для монокристаллических образцов, которые необходимо сохранить. Если, с другой стороны, часть или весь материал кристаллического образца может быть измельчен, порошковая дифракционная идентификация обычно является лучшим вариантом для идентификации кристаллических фаз, при условии, что разрешение пиков достаточно хорошее. Однако алгоритмы сопоставления решеток по-прежнему лучше справляются с обработкой производных супер- и субъячеек.
Более новые версии баз данных кристаллических структур интегрируют визуализацию кристаллических и молекулярных структур . Специализированные или интегративные кристаллографические базы данных могут предоставлять вывод морфологии или визуализации тензора .
Кристаллическая структура описывает трехмерное периодическое расположение атомов , ионов или молекул в кристалле . Элементарная ячейка представляет собой простейшую повторяющуюся единицу кристаллической структуры. Это параллелепипед, содержащий определенное пространственное расположение атомов, ионов, молекул или молекулярных фрагментов. Из элементарной ячейки кристаллическая структура может быть полностью реконструирована посредством трансляций .
Визуализация кристаллической структуры может быть сведена к расположению атомов, ионов или молекул в элементарной ячейке с контурами ячеек или без них. Элементы структуры, выходящие за пределы отдельных элементарных ячеек, такие как изолированные молекулярные или полиэдрические единицы, а также цепочечные, сетчатые или каркасные структуры, часто можно лучше понять, расширив структурное представление на соседние ячейки.
Пространственная группа кристалла — это математическое описание симметрии, присущей структуре. Мотив кристаллической структуры задается асимметричной единицей , минимальным подмножеством содержимого элементарной ячейки. Содержимое элементарной ячейки может быть полностью реконструировано посредством операций симметрии пространственной группы на асимметричной единице. Интерфейсы визуализации обычно позволяют переключаться между асимметричной единицей и представлениями полной структуры.
Связи между атомами или ионами можно идентифицировать по характерным коротким расстояниям между ними. Их можно классифицировать как ковалентные , ионные , водородные или другие связи, включая гибридные формы. Углы связей можно вывести из векторов связей в группах атомов или ионов. Расстояния и углы связей можно сделать доступными пользователю в табличной форме или интерактивно, выбрав пары или группы атомов или ионов. В шаростержневых моделях кристаллических структур шары представляют атомы, а палочки — связи.
Поскольку органические химики особенно интересуются молекулярными структурами , может быть полезно иметь возможность интерактивно выделять отдельные молекулярные единицы из чертежа. Органические молекулярные единицы должны быть представлены как в виде двумерных структурных формул , так и в виде полных трехмерных молекулярных структур. [32] Молекулы в позициях особой симметрии должны быть реконструированы из асимметричной единицы. Кристаллографы белков интересуются молекулярными структурами биологических макромолекул , поэтому необходимо предусмотреть возможность представления молекулярных субъединиц в виде спиралей , листов или катушек соответственно.
Визуализация кристаллической структуры может быть интегрирована в кристаллографическую базу данных . В качестве альтернативы данные о кристаллической структуре обмениваются между базой данных и программным обеспечением визуализации, предпочтительно с использованием формата CIF . [33] Кристаллографические базы данных на основе веб-технологий могут интегрировать возможности визуализации кристаллической структуры. [34] В зависимости от сложности структуры, освещения и 3D-эффектов визуализация кристаллической структуры может потребовать значительного количества вычислительной мощности, поэтому фактическая визуализация обычно выполняется на клиенте .
В настоящее время веб-интегрированная визуализация кристаллической структуры основана на Java-апплетах из проектов с открытым исходным кодом , таких как Jmol . [35] Веб-интегрированная визуализация кристаллической структуры предназначена для изучения кристаллических структур в веб-браузерах , часто поддерживающих широкий цветовой спектр (до 32 бит) и адаптацию размера окна. Однако веб-генерируемые изображения кристаллической структуры не всегда подходят для публикации из-за таких проблем, как глубина разрешения, выбор цвета, контрастность оттенков серого или маркировка (позиционирование, тип шрифта, размер шрифта). [36]
Минералоги , в частности, интересуются морфологическими проявлениями отдельных кристаллов , определяемыми фактически сформированными гранями кристаллов (tracht) и их относительными размерами (habit). Более продвинутые возможности визуализации позволяют отображать характеристики поверхности, несовершенства внутри кристалла, освещение (отражение, тень и полупрозрачность) и 3D-эффекты (интерактивная вращаемость, перспектива и стереопросмотр). [37] [38]
Кристаллофизики , в частности, интересуются анизотропными физическими свойствами кристаллов. Направленная зависимость физических свойств кристалла описывается трехмерным тензором и зависит от ориентации кристалла. Формы тензора становятся более ощутимыми при добавлении эффектов освещения (отражение и тень). Двумерные интересующие сечения выбираются для отображения путем интерактивного вращения тензора вокруг одной или нескольких осей. [39]
Данные о морфологии кристаллов или физических свойствах могут храниться в специализированных базах данных или добавляться в более полные базы данных о кристаллических структурах. База данных о морфологии кристаллов (CMD) является примером веб-базы данных о морфологии кристаллов с интегрированными возможностями визуализации.
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ){{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ){{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ){{cite book}}
: CS1 maint: отсутствует местоположение издателя ( ссылка ){{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка )