WWW.DIS.KONFLIB.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

 
<< HOME
Научная библиотека
CONTACTS

Pages:     | 1 |   ...   | 2 | 3 || 5 | 6 |   ...   | 16 |

Базовые свойства галактик местного объема (

-- [ Страница 4 ] --

При создании баз данных различного уровня и содержания необходимо обращать внимание на проблемы разнородности данных, форм их представления и информационной полноты. На этапе проектирования базы данных все эти вопросы сыграли свою немаловажную роль.

Существуют принципиальные различия между описанием базы данных и самой базой данных. Описанием базы данных является ее схема. Схема создается в процессе проектирования базы. При этом предполагается, что она может модифицироваться, но достаточно редко. Однако содержащаяся в базе данных информация может меняться часто — например, при вставке новых данных или изменении существующих. Совокупность информации, хранящейся в базе данных в любой определенный момент времени, называется состоянием базы данных. Следовательно, одной и той же схеме базы данных может соответствовать множество ее различных состояний.

В основу схемы и состояния Базы Данных галактик Местного объема (LVG) был положен Каталог ближайших галактик (CNG) (Karachentsev et al.

2004). Выборка объектов была обновлена и расширена в настоящий момент до 869 объектов. В Базу Данных LVG также были включены последние наблюдательные данные и результаты, значительная часть которых получена на 6-метровом телескопе (БТА) сотрудниками лаборатории внегалактической астрофизики и космологии САО. В связи с этим был расширен набор наблюдательных параметров объектов по сравнению с CNG. Также, база данных LVG пополнилась сводкой изображений галактик размером 66 из обзоров Sloan Digital Sky Survey (SDSS) и Digitized Sky Survey (DSS) в фильтрах B, R и J. Все это нашло свое отражение как в схеме, так и в состоянии Базы Данных. В LVG предусмотрено хранение следующей информации:

— изображения объектов;

— наблюдаемые параметры (размеры, степень сжатия, фотометрические величины, скорости, типы, потоки);

— физические параметры (расстояния, светимости, пространственные характеристики, величина поглощения, потоки и звездные величины в различных фильтрах). Разработка базы данных проводилась с учетом возможности расширения хранимой информации.

При проектировании структуры базы данных использовался метод семантического моделирования, который представляет собой моделирование структуры данных, опираясь на смысл этих данных, и отношений между ними.

Таким образом, осуществляется детализация хранилищ данных. В качестве инструмента семантического моделирования используются различные варианты диаграмм сущность-связь (ER - Entity-Relationship) (Дейт 2005). ERдиаграмма содержит информацию о сущностях системы и способах их взаимодействия, включает идентификацию объектов, важных для предметной области (сущностей), свойств этих объектов (атрибутов) и их отношений с другими объектами (связей). Основное достоинство метода состоит в том, что модель строится методом последовательных уточнений первоначальных диаграмм.

Как уже отмечалось выше, база данных галактик Местного Объема построена на основе БД PostgreSQL, поэтому при построении ER-диаграммы учитывались особенности этой конкретной СУБД. В связи с этим, проводилось построение физической ER-модели, которая учитывает такие особенности СУБД, как допустимые типы и наименования полей и таблиц, ограничения целостности и т.п.

При разработке ER-моделей на первом этапе необходимо определить следующую информацию:

o Список сущностей предметной области;

o Список атрибутов сущностей;

o Описание взаимосвязей между сущностями.

При проектировании базы данных LVG первоначально были выделены следующие сущности:

a. objects – объекты, входящие в БД LVG;

b. names – имена галактики;

c. magnitude – звездные величины;

d. flux – величины потоков в различных фильтрах;

e. distance – расстояния;

f. diameter, axis_ratio – размеры;

g. cz – лучевые скорости;

h. hiwidth – ширины линий;

i. morphology – морфологические типы;

j. path – параметры, описывающие данные файлового архива;

k. refs –источники данных.

Атрибут сущности именованная характеристика, являющаяся некоторым свойством сущности, соответственно список атрибутов определяется для каждой сущности индивидуально. Для создания взаимосвязей между сущностями используется связь типа один-ко-многим – один экземпляр первой сущности связан с несколькими экземплярами второй сущности.

Как правило, все варианты диаграмм сущность-связь основываются на том, что рисунок всегда нагляднее текстового описания. Все такие диаграммы используют графическое изображение сущностей предметной области, их свойств (атрибутов) и взаимосвязей между сущностями.

В Приложении А на Рисунке 1.1 представлена разработанная схема физической ER-модели базы данных LVG.

В PostgreSQL логически связанные данные хранятся в двумерных структурах, называемых таблицами (Уорсли 2003). Каждая сущность в модели представляет собой таблицу базы данных, каждый атрибут (изображается ромбиком) становится колонкой соответствующей таблицы (на этом этапе учитываются допустимые для данной СУБД типы данных и наименования столбцов) и изображается в виде прямоугольника с наименованием.

Вводится некий неизбыточный набор атрибутов — первичный ключ сущности — значения их в совокупности являются уникальными для каждого экземпляра сущности. Сущность может иметь несколько различных ключей. В некоторых сущностях появляются дополнительные атрибуты — это ключевые атрибуты родительских таблиц, мигрировавших в дочерние таблицы для того, чтобы обеспечить связь между таблицами посредством внешних ключей. Таким образом, связи реализуются путем миграции ключевых атрибутов родительских сущностей и создания внешних ключей.



Ключевые атрибуты изображаются на диаграмме со значком ключа, внешние ключи дополнительно помечены как FK (Foreign Key). Взаимосвязи между двумя сущностями изображаются линией со стрелкой, отношение читается вдоль линии, начиная со стрелки.

Все сущности на диаграмме образуют условно 4 уровня, что определяет структуру таблиц базы данных LVG.

основополагающую таблицу, содержащую идентификатор (id) объекта — первичный ключ данной сущности и внешний ключ для сущностей второго уровня, основное имя (base name) объекта -- уникальный ключ, координаты и ряд вычисляемых параметров объекта (атрибутов). Таблица objects является родительской таблицей для таблиц второго уровня.

2-й уровень образуют таблицы основных наблюдательных параметров галактики: name, magnitude, flux, distance, diameter, axis_ratio, cz, hiwidth, morphology, path..Таким образом, было сформировано 10 таблиц 2 уровня -- это таблицы параметров, значения которых могут корректироваться. Поскольку, в базе данных хранится каждое значение со ссылкой на источник, одно из которых с помощью атрибута preferable считаем основным на данный момент и визуализируем. Существует возможность просмотра всех значений данного параметра. Эти таблицы содержат различный набор полей и строк (список атрибутов), который определяется каждым конкретным параметром.

Обязательными атрибутами здесь являются: id -- внешний ключ для связи с таблицей objects; атрибут, определяющий непосредственно основной параметр данной таблицы; атрибуты preferable; note (комментарии); muser (пользователь -- автор данной записи); mdate (дата добавления/модификации записи).

Принимая во внимание разнородность наблюдательных данных, необходимо учесть максимально возможную их параметризацию и различные специфические особенности. В связи с этим, для ряда атрибутов таблиц второго уровня необходимо образование дополнительных таблиц. Соответственно, 3-й уровень образуют две сущности refs (данные по источникам данных) и qualities (данные, определяющие качество параметра), являясь родительскими для таблиц второго уровня, таким образом, образуя также два обязательных атрибута этих таблиц.

И наконец, 4-й уровень образуют 5 сущностей, соответственно являющиеся также родительскими для таблиц второго уровня. Выделение этого уровня обусловлено исключительно особенностями наблюдательных параметров.

К примеру, таблица distance требует 3-х дополнительных характеристик:

method – методы измерения расстояний, measurement – типы измерения, passband – фильтры; таблица magnitude также 3 таблиц: magtypes – тип параметра, units – единицы измерения, passband.

модифицированы и расширены, что является чрезвычайно важным и в чем видится заметное преимущество. Кроме этого, в дальнейшем в базу данных возможно дополнительно вносить характеристики, важные с точки зрения организации базы данных как информационной системы.

В базу LVG также входят представления (view), необходимые для более гибкой работы с БД и организации Web-доступа, и последовательности. Для расчета глобальных параметров объектов и, также, работы с вычисляемыми параметрами объектов были написаны пользовательские функции, с использованием встроенного процедурного языка SQL, и функции-триггеры.

Список пользовательских функций представлен в Таблице 1 Приложения В.

Как видно на схеме базы данных (Рисунок 1.1 Приложения А), в таблице parameters полностью представлены параметры галактик выборки (таблица lv), вычисляемые в автоматическом режиме при изменении базовых параметров с помощью пользовательских функций.

Для осуществления организационной поддержки и обеспечения доступа к архивным данным была разработана система политик доступа к БД на уровне групп пользователей. Организация поддержки обеспечивает регулирование поступления данных, корректное наполнение базы, необходимую реорганизацию как структуры, так и данных и т.п. Системой политик было обусловлено дополнительно создание следующих групп пользователей с различным уровнем доступа к базе данных:

— managers (полный доступ);

— editors (выбор, редактирование, пополнение данных);

— guest (выбор данных).

принадлежностью пользователя к определенной группе. Создание группы пользователей продиктовано исключительно необходимостью организации доступа к базе данных через Web-интерфейс.

Обеспечение информационной безопасности в настоящее время является пользователей, использование безопасного подключения пользователей к базе является обязательным требованием. При проверке паролей пользователей применяется алгоритм шифрования md5.

1.4 Организация Web-доступа Реализация методов доступа к архивным данным зависит от архитектуры используемой базы данных. Как упоминалось выше, к преимуществам БД PostgreSQL относится гибкость API, позволяющая создавать программные интерфейсы. В PostgreSQL реализован программный интерфейс для достаточно широкого спектра программных языков.

Для реализации Web-доступа к базе данных LVG использовались программные языки PHP и JavaScript (Аргерих 2006; Гешвинде & Шенинг 2003, Мазуркевич & Еловой 2004; http://www.php.net/; http://www.php.ru/).

http://www.sao.ru/lv/lvgdb.

Список галактик, входящих в БД LVG представлен в двух видах:

Общий список имен галактик Местного Объема, с возможностью выхода на основную страницу объекта.

Общий список имен галактик Местного Объема с сортировкой по координате R.A. (на эпоху 2000.0) и разбивкой на страницы по объектов на каждой, также с возможностью выхода на основную страницу объекта.

Весь набор параметров объекта, находящихся в БД, сведен в единую WEB-страницу, образующую визитную карточку объекта -- основную страницу объекта, пример которой приведен на Рисунке 1.1. На нем можно увидеть, что основная страница включает в себя:

— список существующих имен объекта;

— оптическое изображение галактики. Для изображений SDSS реализована инвертированного изображения;

— таблицу, содержащую набор базовых наблюдаемых параметров;

— таблицу, содержащую набор вычисляемых параметров;

— таблицу, содержащую основные параметры, характеризующие светимость галактики в различных фильтрах, и дающие представление о темпах звездообразования в ней, включая изображения объекта в фильтре H..



Pages:     | 1 |   ...   | 2 | 3 || 5 | 6 |   ...   | 16 |
 




 
© 2013 www.dis.konflib.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.