Gellish

Материал из PraxOS

Перейти к: навигация, поиск

Онтологический язык представления информации о мире Gellish

В PraxOS мы работаем над проектом Gellish Russian

Ниже идет перевод страницы http://gellish.wiki.sourceforge.net/

Содержание

1. Gellish

Проект Gellish имеет целью развивать Метод Моделирования Gellish для моделирования знаний и информации, а так же расширять Gellish English и его ителлектуальный Gellish-Английский Словарь (ранее называвшийся STEPlib) и другие варианты Gellish для различных естественных языков. Проект также нацелен на документирование и руководство для приложений Gellish, создания и использования баз данных Gellish, интеграции данных из различных источников, а также для нейтрального по отношению к поставщикам софта и системно-независимого обмена Сообщениями Gellish между системами.

2. Метод Моделирования Gellish

Метод Моделирования Gellish -- это метод моделирования, который использует Gellish English для моделирования по меньшей мере в следующих пяти областях:

1. Создание словарей в форме собраний Моделей Определений для разработки компьютерно интерпретируемых Словарей/Таксономий предметных областей как расширений общеиспользуемого интеллектуального Словаря Gellish.

2. Создание библиотек знаний в форме собраний Моделей Знаний для выражения знания о видах предметов в компьютерно интерпретируемой форме.

3. Выражение Требований и Спецификаций Стандартов в форме Моделей Требований для компьютерно интерпретируемых описаний стандартных (производственных) продуктов и компонентов, их свойств и функционирования как в каталогах продукции, так и в общих требованиях, содержщихся в международных стандартах и руководствах компаний по лучшим практикам.

4. Создание Информационных Моделей Производственных Мощностей, содержащих данные и документы о конкретных объектах, включая данные и документы о дизайне объектов, равно как и о сооружённых производственых мощностях, их эксплуатации и ремонте.

5. Обмен сообщениями, включая запросы, ответы и утверждения между поддерживающим Gellish софтом для Семантической Сети Gellish.

Метод Моделирования Gellish улучшает традиционные методы моделирования данных в различных отношениях. Традиционное моделирование данных, например, объектно-ролевое моделирование (ORM) или моделирование сущность-связь (entity-relationship, ER), не обеспечивает ни словаря, ни стандартизированных типов отношений для выражения фактов. Вследствие этого различные модели, получающиеся при приложении этих методов, реализуются как различные взаимно несовместимые базы данных, где данные, которые хранятся в одной базе данных трудно передать в другое хранилище данных. Эта проблема может быть решена использованием Метода Моделирования Gellish, который использует концепты Словаря Gellish English, включая его стандартизированные типы отношений, чтобы создать модели знаний как экземпляры Базы Данных Gellish. Когда концептуальные модели данных выражаются как модели знаний в Gellish English и хранятся в Базе Данных Gellish, они могут непосредствованно использоваться для управления созданием информационных моделей конкретных объектов, где такие данные могут храниться также прямо в Базе Данных Gellish без необходимости создавать для них отдельную базу данных. Это обеспечивается тем фактом, что База Данных Gellish состоит из одной или более универсально приложимых таблиц базы данных. Эта общая применимость устраняет необходимость создания специальных дизайнов баз данных для новых приложений. Как следствие, больше не требуется конвертировать концептуальные модели данных в физические модели данных, чтобы создать структуру базы данных. Это также открывает возможность создать софт, который будет работать для любой базы данных Gellish или с объединенным содержанием нескольких баз данных.

3. Что такое Gellish English

3.1 Структурированный формальный English

Gellish English -- это общеприменимый язык хранения данных и обмена данными, который не нуждается в модели данных, но может быть непосредственно использован для выражения знаний и информации. Хотя Gellish English использует терминологию естественного английского языка, тем не менее, Gellish может быть также назван формальным языком, поддающимся компьютерной интерпретации, так как он ограничивает язык формально определенным компьютерно интерпретируемым подмножеством, однако не определяет собственный словарь. Английский вариант Gellish, Gellish English поэтому составлеяет структурированное подмножество естественного английского, в том же смысле, в каком Голладский вариант (Gellish Nederlands) является подмножеством голландского языка, и в том же смысле, в каком другие варианты Gellish являются структурированными подмножествами других естественных языков. Gellish предназначен для использования в качестве общеприложимого языка выражения информации и знаний системонезависимым и конвертируемым в любой естественный язык образом, потому что он использует независимые от естественного языка уникальные идентификаторы. Gellish предназначен помочь в стандартизации баз данных, предоставлении универсальной структуры данных для обмена данными, общеприложимой возможности ведения баз данных. Его главные преимущества перед традиционными методами моделирования информации и знаний:

   * Его структура данных универсальная и гибкая и может быть расширена без изменений в софте или изменений в определениях базы данных, в то время как традиционные структуры данных фиксированы и негибки.
   * Это открытый язык, в котором может быть выражена любая семантически корректная информация или знание, в то время как традиционные структуры баз данных позволяют хранить только те данных, для которых эти системы спроектированы.
   * Он имеет обширный стандартный "интеллектуальный" словарь концептов и типов отношений в форме таксономии/онтологии, что устраняет неопределенности и ведет к тому, что данные из различных источников могут быть легко интегрированы, в то время как традиционные базы данных обычно не используют стандартные концепты ни для их определения, ни для их содержания.
   * Он открыт, системонезависим и бесплатно доступен на условиях лицензии Открытого Кода, в то время как большинство структур данных и стандартов на их содержание закрыты, зависят от прикладного софта, и находятся  чьей-то  собственности.
   * Он имеет встроенные возможности перевода, использует обычные английские термины и выражения и не использует отдельный мета-язык для своего определения, в то время как традиционные системы нуждаются в специаьном переводе для каждого отдельного случая и требуют использования отдельного мета-языка для своего определения, а также обычно выражены на "языке программистов".

Gellish основан на принципе рассмотрения знания и информация как собрания элементарных фактов, которые могут быть выражены как маленькие компьютерно интерпретируемые выражения (маленькие предложения) одинаковые для любого естественного языка. Эти элементарные выражения имеют структуру объект-отношение-объект (object-relationship-object, ORO). Примеры таких выражений Gellish English:

   * wheel <can be a part of a> car
   * колесо <может быть частью какого-то> автомобиля

или

   * the Eiffel tower <is located in> Paris
   * Эйфелева башня <находится в> Париже

Такие выражения Gellish используют стандартные термины для концептов, которые выбираются из общего Словаря Gellish English и также используют стандартизованные типы отношений из этого словаря. Как следствие, знания и информация автоматически согласованы и могут быть непосредственно интегрированы и интерпретированы компьютерами. Такие выражения могут храниться в универсальной Базе Данных Gellish, запрашиваться посредством Запросов Gellish и обмениваться между системами посредством Сообщений Gellish, которые используют стандартизированный интерфейс.

3.2 Общеприложимая структура данных

Метод Моделирования Gellish включает определение универсальной структуры базы данных, хотя Gellish может быть также использован для усиления традиционных баз данных путем стандартизации их содержания и тем самым упростить интеграцию данных и обмен данным. С перспективы информационных технологий Gellish может рассматриваться как большая интегрированная модель данных, которая гибка и общеприменима и может быть реализована в одной таблице. Она гибка, потому что ее область применения и возможности смыслового выражения могут быть расширены без модификации структуры данных Gellish. Она общеприложима, потому что имеет общеприложимые стандартные типы отношений и встроенное предметноспецифичное знание из различных дисциплин, так что типы отношений и знания могут быть легко расширены на другие предметные области.

3.3 Интеллектуальный Английский Словарь

Интеллектуальный Английский Словарь Gellish расширяет стандартный английский словарь в том, что он содержит дополнительное знание, выраженное в компьютерно интерпретируемыех отношениях между концептами в словаре. Это делает словарь Gellish "интеллектульным словарем", в котором концепты организованы в таксономию, а дополнительные отношения между ними превращают его в онтологию. Английский Словарь Gellish включает общие отношения, которые формируют "высшую" онтологию, или онтологию мира, а также содержит специфические отношения, которые интегрируют онтологии различных предметных областей.

Использование Gellish

Существуют четыре основных вида использования Gellish English:

1. Использование в качестве Словаря 2. Использование в качестве Языка 3. Использование в качестве Языка моделирования данных 4. Использование в качестве Языка запросов

4.1 Использование в качестве Словаря

Использование электронного словаря Gellish English Dictionary. Может существляться либо в режиме отдельного программного приложения Словаря Gellish (такого как браузер STEPlib), либо включением словаря (или его подмножества) в качестве стандартных справочных данных в одну или более прикладных систем.

Примером последнего использования является гармонизация систем путем стандартизации на базе Словаря Gellish в качестве общей терминологии в прикладных системах. Например, чтобы гармонизовать типы оборудования и типы документов в различных базах данных компании.

Например:

1. Использование для Стандартизации Данных: чтобы стандартизовать данные в базе(ах) данных. Например, стандартизовать классификатор оборудования и его свойств, или стандартизовать типы документов, например, в системах ERP, системах проектирования, системах ремонта и обслуживания, или системах управления документами.

2. Использование для стандартизации ключевых слов в системах управления документами.

3. Использование для улучшений в поисковых машинах путем использования терминов и синонимов (с возможными частными расширениями) словаря Gellish в качестве основы для назначения ключевых слов и для поиска по ключевым словам; а при использовании таксономии (иерархии подтипа-супертипа) видов предметов (классов) из Таксономии Gellish, чтобы также найти информацию, которая классифицирована подтипами терминов.

Использование Словаря Gellish English может включать не только использования имен или текстовых определений, но также возможно и использование иерархии отношений "подтип-надтип" и возможно фактов, которые по определению верны для определенного концепта.

Приложения, которые использовают только словарь, могу выбрать из Базы Данных Словаря Gellish только строчки, которые определяют концепты и строчки, которые определяют имена синонимов для этих концептов. Эти строчки могут быть распознаны по типу отношений, которые они используют, ибо эти строчки содержат только типы отношений, которые обозначены следующими Gellish-фразами:

   * is a specialisation of 
   * это специализация -- такая строчка определяет концепт как являющийся подтипом другого концепта и дает текстовое определение для концепта
   * is a qualification of 
   * это уточнение -- такая строчка определяет, что количественный или качественный аспект определяет уточнение концептуального аспекта. Например, красное -- это уточнение  цвета, а ASTM 317 -- уточнение нержавеющей стали.
   * is a synonym of
   * это синоним
   * is an abbreviation of
   * это аббревиатура

Эти типы отношений являются также стандартными типами отношений, которые используются для расширения Словаря определением добавочных концептов. Рекомендации по расширению Словаря даются в Руководстве по Расширению Словаря Gellish English. Краткое изложение этих руководящих указаний дано в правилах для надлежащего определения новых концептов и в правилах для именования концептов.

Если вы нуждаетесь только в подмножестве концептов в Словаре, то тем не менее рекомендуется импортировать полную таксономию, но отметить только те концепты, которые будут видимы пользователям. Это будет упрощать апгрейд для новых релизов Словаря Gellish English и будет поддерживать включение частных расширений.

<далее пока не переведено>

4.2 Usage as a Language Using Gellish as a language implies the usage to describe either individual objects, their components, properties and behaviour, and/or to describe activities or knowledge or requirements or standard specifications of kinds of things or all of those.

This implies that individual things are classified by concepts from the Gellish Dictionary, and in addition to it implies the usage of the standard relation types for making expressions of the kind Object-Relationtype-Object (ORO).

Using the full Gellish English language for the modelling of information or knowledge is illustrated in the figure below. Facility_Information_Model_-_Jul2008.gif














The figure illustrates the architecture of a Facility Information Model and its parts. The left hand of the figure illustrates a model of a facility, in this example an LNG plant. The facility is decomposed in components, the components have properties and are related to each other and they are related to processes and activities in which they are involved. Each element in the facility model can also be related to one or more documents in a document repository, being the second part of the facility information model. This enables to build powerful search engines that can use the structure of the facility model to find documents about the facility components or to use the structure of the smart dictionary to find documents and requirements that are applicable for them. Each element of the facility model and each document is also related by a classification relation to a concept (a class) in the Gellish dictionary that is depicted on the right hand side of the figure. And finally the third part illustrates requirements about kinds of things, in the form of relations between concepts in the Gellish dictionary. Note that the classification relations determine which requirements are applicable to which objects in the facility model.

Alltogether the figure illustrates the following ways to use the full Gellish language:

   * To express knowledge for its storage, retrieval and for the exchange of knowledge between application systems
   * To express requirements and standard specifications for facilities and products and for the required delivery of data and documents
   * To model products (product modeling or product design) for the storage, retrieval and exchange of data and documents about them, such as in product catalogues
   * To verify designs or to verify observed real world objects against requirements and specifications
   * To create Facility Information Models or to express business transactions, measured data, or any other information about facilities and their components as an integration of information from various sources in a central or decentralized distributed database


Depending on these kinds of usage a different subset of relation types is applicable. Those subsets of the available relation types are described in the various parts of the Gellish Modeling Method. Requirements specifications and templates for product catalogues mainly use relation types that specify relations between kinds of things. Such relation types are typically indicated by phrases that start with 'can be...', 'can have...', 'shall be...' or shall have...'. Sometimes, the relation type phrase begins with 'has by definition...' or 'is by definition...'. For example, you can specify that a pump shall have shaft and shall have a volumetric capacity in Gellish as follows: Name of left hand object Name of relation type Name of right hand object pump shall have as part a shaft pump shall have as aspect a capacity (volume flow rate) Product descriptions and operational facilities mainly use relation types that specify relations between individual things and classification relations that specify that an individual thing is related to a kind of thing (a class). These kinds of relation types typically start with 'is a...' or 'has a...', whereas the classification relation is expressed by the phrase 'is classified as a'. For example, the information that P-1001 is a pump that has a capacity of 5 dm3/s is described in Gellish as follows: Name of left hand object Name of relation type Name of right hand object UoM P-1001 is classified as a pump P-1001 has as aspect capacity of P-1001 capacity of P-1001 is classified as a capacity (volume flow rate) capacity of P-1001 is quantified on scale as 5 dm3/s Note that the relation types and the concepts pump, capacity (volume flow rate), 5 and dm3/s are all standard Gellish English concepts that are selected from the dictionary. The other objects, P-1001 and capacity of P-1001 are private objects that are introduced in the Gellish language by their classification relations. 4.3 Usage as Data Modelling language Using the Gellish English language to specify data models, thus using it as a data modeling language. This will result in Gellish English conceptual data models, being data models that are expressed using the relation types that are standardised in Gellish and that use the concepts that are already defined in the Gellish Dictionary or their proprietary extending where necessary. Data models expressed in Gellish have several advantages, such as that they are documented in a database table, they are extensible and they can be directly used by software to guide the creation of data instances, without the need for the design of a physical data model.

4.4 Usage as a Query language Using the Gellish language to Query a Gellish Database or to communicate in dialogues about transactions with requests, promises, statements, etc., thus using Gellish English as a query language or as a business communication language.

Gellish Databases and Messages

Gellish English Databases enable the storage of virtually any data. They can contain any number of identical database tables. Therefore Gellish Database systems have a universal table structure, which makes them generally applicable and extendable without the need to redefine their data structure (data model). All Gellish databases have as common characteristic that they enable to store any knowledge and information that can be expressed in the Gellish English language. They also have as common characteristic that they have the capability to import and integrate data that are expressed in the form of the content of other Gellish Database tables or the content of Gellish messages.

Gellish messages can be exchanged between computer systems, using a standard data exchange protocol, such as the SOAP protocol. Such a message consists of an envelop, a header and a body. The body is formed by a collection of Gellish expressions, similar to rows in a Gellish Database table. When the SOAP protocolis used, the Gellish message is exchanged in XML format. Such messages can be sent as a query or as a response in peer to peer networks of Gellish enabled applications to query a central database or a decentralized distributed database.

Data integration requires the use of a common language, which includes a common dictionary of concepts and relation types. Therefore it is important that users of Gellish should have the discipline to obey the rules for correct Gellish. You should carefully evaluate whether new concepts, especially relation types, are really needed or that existing concepts are already available in the Gellish Dictionary. If you think that a new concept is really required, then you are strongly recommended to provide feedback and to propose your extensions as enhancements of the Open Source and public domain Gellish Dictionary. This is in line with the conditions of the Open Source License that allows you to download and use the Gellish language definition and dictionary.

Truncated Gellish

Normal use of Gellish includes the usage of the full standard Gellish Dictionary (or a subset of it), possibly with proprietary extensions. However, in practice users may wish to use their own (proprietary) Domain Dictionary and limit the use of Gellish concepts to the concepts that are defined in the upper ontology of Gellish (the TOPini part) and its syntax, while not using the remainder of the Gellish Dictionary. This is called the usage of "Truncated Gellish". The Gellish Modeling Method provides guidelines on how to create such a Gellish compliant Domain Dictionary.

The use of Truncated Gellish with a proprietary Domain Dictionary is convenient and fast, because of the familiarity of its users with their own dictionary. However there are two disadvantages of using Trucated Gellish: 1. Data integration remains a problem as long as no common dictionary is used. So you cannot simply integrate data from other parties that do not use your dictionary. 2. All the modelling knowledge that is contained the Gellish Dictionary is not utilised. For example, the power of the Gellish taxonomy (and thus the inheritance capabilities, serching on subtypes and semantic verification possibilities), the synonyms, the definitions and the distinctions between objects and their roles, the standard units of measure and their conversions, etc.

Nevertheless, the use of Truncated Gellish is supported in the Gellish Modeling Method. If people choose to develop a Domain Dictionary that overlaps the Gellish Dictionary, then it is recommended to eliminate the above-mentioned disadvantages to a large extent by making a mapping between their own terminology and the concepts in the Gellish Dictionary. This can be done by the creation of a Gellish Database table with <is a synonym of> relations or <is the same as> relations and to identify and use the UID's of the Gellish Dictionary concepts also for their own concepts and to add subtypes for proprietary concepts where necessary. Such a mapping table is for example available for ISO 15926-4. Several companies also made such mappings. For example, mappings were made for equipment types and property types for various database implementations, such as for various SAP implementations for maintenance and inspection. In fact in such cases the mapping table indicates which subset of the Gellish Dictionary is used in the application. A possible implementation could then even use the full Gellish dictionary/taxonomy at the background, while the software only shows the proprietary synonyms of the subset to the users.

Gellish in RDF / Notation 3

Normal use of Gellish includes the specification of a number of auxiliary facts for each main fact that is expressed in Gellish. Auxiliary facts are for example, facts about the used language, the context for naming and validity, the status, the originator, the date of creation and modification of a fact, unique identifiers, etc. All those auxiliary facts can be expressed on one row in a Gellish Database or data exchange file or message. Users may wish to ignore some or all of those auxiliary facts in their implementation.

For that reason standard subsets of columns are defined for Gellish Database tables. Each subset table can be represented in RDF / Notation 3. The smallest subset is a triple, which includes a left hand object name, a relation type and a right hand object name. (In RDF those theree components are called subject, property and object). Applications that do not require the implementation of the full set of auxiliary facts can use one of the subsets.

Development and maintenance of Gellish

Gellish Engish is developed and maintained as an International Industry Standard by dr. ir. Andries van Renssen at Shell and at the Delft University of Technology, together with a team of domain experts from several other international companies. Users of Gellish who want to extent the Gellish Dictionary of concepts and relation types are invited to submit their proposals for additions to the Gellish English dictionary or another language variant. Gellish is in use for a large variety of applications, including facility design, plant data integration, database content harmonisation, knowledge storage and retrieval, electronic product catalogues, database prototyping and development, etc. Gellish Engish is a combination and significant extension and at the same time a simplification of the concepts defined in ISO data model standards ISO 10303-221 (AP221) and ISO 15926, especially part 2, 3 and 4 and includes enhanced concept definitions from many other standards.

Gellish Documentation

Explanation of the interpretation of Gellish expressions and the standardrelation types is given on the page Developing Gellish enabled software. For the description of some core concepts of Gellish see the page on basic principles. Extensive guidance is provided in the documentation that is described below and can be provided by support organisations.

The sourceforge website (Download area) contains a number of documents about Gellish:

   * A presentation about Gellish in MS Powerpoint.
   * An example of a Road - This document is intended to provide a first introduction in Gellish. The document describes and example of knowledge about a road and information about a particular road. There are two versions of the document: an English and a Dutch (Nederlands) version. Each document is accompanied by a separate file that contains a Gellish Table with the knowledge and information from the document, expressed in Gellish English and Gellish Dutch respectivily. Each of those files also contains a translation of the terms between the two languages. This illustrates that in one file the knowledge and information is expressed in one language, wheras that knowledge and that information can be presented in both languages without the need to express the facts in the other language.
   * An example of a Gellish Database with knowledge, requirements and a design of a part of a lubrication oil system.
   * The Gellish Application Manual - An extensive manual on the application of Gellish with many examples.
   * STEPlib - The Gellish English Smart Dictionary. The electronic Gellish Dictionary includes an advanced English dictionary, with relations between the terms, and it includes also the Gellish English language definition (its grammar) in a computer interpretable form. It consists of a number of Gellish Database tables expressed in MS Excel files. The tables can be combined in one Gellish Database and imported in any database that is compliant with the Gellish Database definition.
   * Gellish Databases - This document defines the standard Gellish Database table and the meaning of the columns in such a table. Such tables can be implemented as database tables or can be exchanged as a computer interpretable files.
   * A Guide on the extension of Gellish English - This document provides guidance on how to extent the Gellish English Dictionary with your private terminology and how to raise proposals for the extension of the official Gellish Dictionary. See also the summary of the rules for a proper definition of a new concept and rules for names of concepts.
   * Guidelines on the use of Gellish English - This document provides a list of guidelines that provide guidance on the usage of Gellish. It also contains rules to determine whether knowledge or information is expressed in a Gellish compliant way. Those rules form the basis for becoming Gellish certified, which gives the right to use the 'Gellish Powered' logo.
   * Guidelines for the creation of product catalogues in Gellish.
   * A summary of the PhD thesis of the originator of Gellish, with a description og the fundamentals, the definition, development and application of Gellish as a universal data structure and ontology. See also his book 'Gellish, a Generic Extensible Ontological Language'.
Источник — «http://praxos.ru/index.php/Gellish»