Conociendo las Tecnologías de Información Geográfica.

 

Un Sistema de Información Geográfica, (SIG o GIS, en su acrónimo inglés) es un sistema integrado compuesto por hardware, software, personal, información espacial y procedimientos computarizados, que permite y facilita la recolección, el análisis, gestión o representación de datos espaciales.

Descripción: El pionero de la epidemiología, el Dr. John Snow proporcionaría, allá por 1854, el clásico ejemplo de este concepto cuando cartografió la incidencia de los casos de cólera en un mapa del distrito de SoHo en Londres. Este protoSIG permitió a Snow localizar con precisión un pozo de agua contaminado como fuente causante del brote.

El SIG funciona como una base de datos con información geográfica (datos alfanuméricos) que se encuentra asociada por un identificador común a los objetos gráficos de un mapa digital. De esta forma, señalando un objeto se conocen sus atributos e inversamente, preguntando por un registro de la base de datos se puede saber su localización en la cartografía.

El Sistema de Información Geográfica, separa la información en diferentes capas temáticas y las almacena independientemente, permitiendo trabajar con ellas de manera rápida y sencilla, y facilitando al profesional la posibilidad de relacionar la información existente a través de la topología de los objetos, con el fin de generar otra nueva que no podríamos obtener de otra forma.

                                                                                  

Un Sistema de Información Geográfica puede mostrar la información en capas temáticas para realizar análisis multicriterio complejos.

Raster y vectorial: Los software SIG pueden ser raster o vectoriales. El modelo de SIG raster se centra en las propiedades del espacio más que en la precisión de la localización. Compartimenta el espacio en celdas regulares donde cada una de ellas representa un único valor. Cuanto más grandes sean las dimensiones de las celdas (resolución) menor es la precisión o detalle en la representación del espacio geográfico. En el caso del modelo de SIG vectorial, el interés de las representaciones se centra en la precisión de localización de los elementos sobre el espacio. Para modelizar digitalmente las entidades del mundo real se utilizan tres objetos espaciales: el punto, la línea y el polígono.

Los SIG vectoriales son más populares en el mercado. No obstante, los SIG raster son muy utilizados en estudios medioambientales donde la precisión espacial no es muy requerida (contaminación atmosférica, distribución de temperaturas, localización de especies pesqueras, análisis geológicos, etc.).

Imagen raster del Golfo de México generada por un Sistema de Información Geográfica.

Cuestiones a las que puede dar respuesta un SIG.

Las principales cuestiones que puede resolver un Sistema de Información Geográfica son:

·      Localización: Preguntar por las características de un lugar concreto.

·      Condición: El cumplimiento o no de unas condiciones impuestas al sistema.

·      Tendencia: Comparación entre situaciones temporales o espaciales distintas de alguna característica.

·      Rutas: Cálculo de rutas óptimas entre dos o más puntos.

·      Pautas: Detección de pautas espaciales.

·      Modelos: Generación de modelos a partir de fenómenos o actuaciones simuladas.

Por ser tan versátiles los sistemas de información geográfica, su campo de aplicación es muy amplio, pudiendo utilizarse en la mayoría de las actividades con un componente espacial. La profunda revolución que han provocado las nuevas tecnologías ha incidido de manera decisiva en su evolución.

Cartografía vectorial de la red de carreteras de España en el Sistema de Información Geográfica de código libre gvSIG.

Listado de software SIG.

·      Software no libre comercial: ArcGIS (Arcview, ArcInfo), Mapinfo, Maptitude, Geomedia, Autodesk Map, MicroStation Geographics, SmallWorld, Manifold, Idrisi, MapPoint, TatukGIS, TNT Mips, MiraMon.

·      Software libre: GRASS GIS, JUMP, MapServer, Quantum GIS, gvSIG, SAGA GIS.

·      Software no libre freeware: Spring, FGIS.

Open Geospatial Consortium.

El Open Geospatial Consortium (OGC) fue creado en 1994 y agrupa a más de 250 organizaciones públicas y privadas. Su fin es la definición de estándares abiertos e interoperables dentro de los Sistemas de Información Geográfica. Persigue acuerdos entre las diferentes empresas del sector que posibiliten la interoperación de sus sistemas de geoprocesamiento y facilitar el intercambio de la información geográfica en beneficio de los usuarios. Anteriormente fue conocido como Open GIS Consortium.

Las especificaciones más importantes surgidas del OGC son:

·      GML.- Lenguaje de Marcado Geográfico (no confundir con Lenguaje de Marcado Generalizado, también GML)

·      WFS.- Web Feature Service

·      WMS.- Web Map Service

·      WCS.- Web Coverage Service

·      CS-W.- Catalog Service Web

Geomática.

La Geomática es un término científico moderno -considerado a menudo como una rama de la Geografía- que hace referencia a un conjunto de técnicas en las cuales se integran los medios para la recolección, tratamiento, análisis, interpretación, difusión y almacenamiento de la información geográfica. Estos datos espaciales provienen de análisis y mediciones hechos con técnicas como:

·      La cartografía.

·      La teledetección o percepción remota.

·      La fotogrametría.

·      La geoestadística o análisis espacial.

·      Los Sistemas Globales de Navegación por Satélite (GNSS).

·      Los Sistemas de Información Geográfica (SIG).

La geomática es fundamental para todas las ciencias que utilizan datos espacialmente referenciados y ha tenido un importante crecimiento desde la década de 1990. Actualmente existen resultados existosos de la aplicación de las técnicas de Geomática en áreas como Medicina, Geología, Negocios (bienes raíces), Arqueología, Ingeniería Civil, Ingeniería Ambiental, entre otras.

Cartografía.

Mapa de España y Portugal perteneciente a la Enciclopedia Meyers (1885-90).

La cartografía es la ciencia que trata de la representación de la Tierra sobre un mapa. Al ser la Tierra esférica ha de valerse de un sistema de proyecciones para pasar de la esfera al plano. En el fondo este es el problema de la cuadratura del círculo. El problema es aún mayor, pues en realidad la forma de la Tierra no es exactamente esférica, su forma es más achatada en los polos que en la zona ecuatorial a esta figura se le denomina geoide.

Pero además de representar los contornos de las cosas, las superficies y los ángulos se ocupa, también de representar la información que aparece sobre el mapa, según se considere qué es relevante y qué no. Esto, normalmente, depende de lo que se quiera representar en el mapa y de la escala.

Estas representaciones actualmente se están realizando con programas de informática llamados SIG, en los que se puede georreferenciar desde un árbol y su ubicación, hasta una ciudad entera como puede ser sus edificios, calles, plazas, puentes, juridiscciones, etc.

Amberes fue el centro de la cartografía en la segunda mitad del siglo XVI, cuando la ciudad era el principal puerto del imperio español con acceso al Mar del Norte; con el declive del imperio español durante el reinado de Felipe III, y la política ejercida por los gobernadores españoles sobre los flamencos protestantes, gran parte de éstos dejaron los Países Bajos españoles (la actual Bélgica) y pasaron a trabajar en los Países Bajos rebeldes: la "República de las Provincias Unidas de los Países Bajos", determinando así que en la primera mitad del siglo XVII fuese Ámsterdam la principal fuente de cartografía moderna, luego el impulso pasaría a Francia, hasta mediados del siglo XVIII, y de allí en adelante a Gran Bretaña, así como a los Estados Unidos a partir del siglo XIX.

La Ciudad de Buenos Aires es una precursora de este tipo de herramienta de información geográfica, contando actualmente con un sitio de dominio público en donde se brinda dicho programa en una forma simplificada para realizar consultas desde un ordenador personal.

La Mapoteca Virtual del Ministerio de Relaciones Exteriores del Perú, pionera en su género en América Latina, muestra una magnífica colección de los más representativos mapas históricos del Perú y de América del Sur, incluso muchas de las imágenes pueden ser vistas a gran resolución a través de un visualizador sencillo de utilizar.

Información geográfica.

Se denomina Información Geográfica (IG) a aquellos datos espaciales georreferenciados requeridos como parte de las operaciones científicas, administrativas y/o legales. Dichos datos espaciales suelen llevar una información alfanumérica asociada. Se estima que el 80% de los datos corporativos existentes en todo el mundo poseen esta componente geográfica.

Base de datos espacial.

Base de datos espacial (spatial database) es un sistema administrador de bases de datos que maneja datos existentes en un espacio o datos espaciales. El espacio establece un marco de referencia para definir la localización y relación entre objetos. El que normalmente se utiliza es el espacio físico que es un dominio manipulable, perceptible y que sirve de referencia. La construcción de una base de datos geográfica implica un proceso de abstracción para pasar de la complejidad del mundo real a una representación simplificada que pueda ser procesada por el lenguaje de las computadoras actuales. Este proceso de abstracción tiene diversos niveles y normalmente comienza con la concepción de la estructura de la base de datos, generalmente en capas; en esta fase, y dependiendo de la utilidad que se vaya a dar a la información a compilar, se seleccionan las capas temáticas a incluir.

La estructuración de la información espacial procedente del mundo real en capas conlleva cierto nivel de dificultad. En primer lugar, la necesidad de abstracción que requieren los computadores implica trabajar con primitivas básicas de dibujo, de tal forma que toda la complejidad de la realidad ha de ser reducida a puntos, líneas o polígonos. En segundo lugar, existen relaciones espaciales entre los objetos geográficos que el sistema no puede obviar; la topología, que en realidad es el método matemático-lógico usado para definir las relaciones espaciales entre los objetos geográficos puede llegar a ser muy compleja, ya que son muchos los elementos que interactúan sobre cada aspecto de la realidad.

Datos espaciales.

Un modelo de datos geográfico es una abstracción del mundo real que emplea un conjunto de objetos dato, para soportar el despliegue de mapas, consultas, edición y análisis. Los datos geográficos, presentan la información en representaciones subjetivas a través de mapas y símbolos, que representan la geografía como formas geométricas, redes, superficies, ubicaciones e imágenes, a los cuales se les asignan sus respectivos atributos que los definen y describen.

Un dato espacial es una variable asociada a una localización del espacio. Normalmente se utilizan datos vectoriales, los cuales pueden ser expresados mediante tres tipos de objetos espaciales.

Puntos: Se encuentran determinados por las coordenadas terrestres medidas por latitud y longitud. Por ejemplo, ciudades, accidentes geográficos puntuales, hitos.

Líneas: Objetos abiertos que cubren una distancia dada y comunican varios puntos o nodos, aunque debido a la forma esférica de la tierra también se le consideran como arcos. Líneas telefónicas, carreteras y vías de trenes son ejemplos de líneas geográficas.

Polígonos: Figuras planas conectadas por distintas líneas u objetos cerrados que cubren un área determinada, como por ejemplo países, regiones o lagos.

De esta forma la información sobre puntos, líneas y polígonos se almacena como una colección de coordenadas (x,y). La ubicación de una característica puntual, pueden describirse con un sólo punto (x,y). Las características lineales, pueden almacenarse como un conjunto de puntos de coordenadas (x,y). Las características poligonales, pueden almacenarse como un circuito cerrado de coordenadas. La otra forma de expresar datos espaciales es mediante rasterización, la cual, a través de una malla que permite asociar datos a una imagen; es decir, se pueden relacionar paquetes de información a los píxeles de una imagen digitalizada.

Los datos espaciales además se caracterizan por su naturaleza georreferenciada y multidireccional. La primera se refiere que la posición relativa o absoluta de cualquier elemento sobre el espacio contiene información valiosa, pues la localización debe considerarse explícitamente en cualquier análisis. Por multidireccional se entiende a que existen relaciones complejas no lineales, es decir que un elemento cualquiera se relaciona con su vecino y además con regiones lejanas, por lo que la relación entre todos los elementos no es unidireccional. Es decir, todos los elementos se relacionan entre si, pero existe una relación más profunda entre los elementos más cercanos.

Álgebra.

El álgebra utilizada se denomina álgebra ROSE (RObust Spatial Extension) el cual está basada en los tipos de datos espaciales reales (STD - spatial data types), pero en este caso, los objetos no están definidos en el espacio Euclidiano continuo sino que en términos de la malla que discretiza el espacio, esto debido a que los cálculos computacionales son discretos. Los operadores espaciales se definen de la siguiente forma.

Operadores de selección:

Point Query (PQ)

Dado un punto p, encontrar todos los objetos espaciales O que lo contienen.

·      PQ(p)={O|p pertenece a O.G ≠ Ø}

Range or region query (WQ)

Dado un polígono P de consulta, encuentre todos los objetos O que intersectan P. Cuando P es rectangular, se llama windows query.

·      WQ(P)={O|O.G ∩ P.G ≠ Ø}

Agregación espacial.

Es una variante de búsqueda por vecino más cercano. Dado un objeto O’, encuentre los objetos o que tiene una mínima distancia de o’.

·      NNQ(o')={o|para todo o: dist(o'.G,o.G) ≤ dist(o'.G,o.G)}

Join espacial.

Es uno de los más importantes operadores. Cuando dos tablas R y S son unidas basado en un predicado espacial θ, la unión de las tablas es llamada espacial. Una variante de este operador en SIG es la superposición de mapas (map overlay). Este operador combina dos conjuntos de objetos espaciales para formar un nuevo conjunto. Las fronteras de este conjunto son determinadas por los atributos no espaciales asignados por la operación de superposición. Por ejemplo, si la operación asigna un mismo valor de un atributo no espacial a dos objetos vecinos, ellos se juntan o mezclan.

Métodos de acceso espacial.

Para evitar la revisión exhaustiva de los datos en una base de datos, se crean índices que reducen el número de elementos a visitar en la base de datos en un procesamiento de consulta. La clásica indexación por B-tree no es aplicable en el caso espacial donde no existe un orden único de los valores de claves. Es por este motivo que existen tres categorías de métodos de acceso espacial, las PAM (Point Access Method), R-Tree, las SAM (Spatial Access Method), los cuales se utilizan de acuerdo al tipo de dato en el que está la base de datos espacial ya sea raster o vectorial. Aunque se han creado los benchmarks que comparan diferentes métodos, los resultados no son concluyentes, pero se recomienda utilizar cualquiera de ellos. Un índice R-tree aproxima cada geometría en un único rectángulo que la acota minimizando los espacios llamado MBR (Minimal Bounding Rectangle) y organiza una colección de objetos espaciales en una jerárquica donde las hojas contienen punteros a los datos y los nodos intermedios contienen el rectángulo mínimo que contiene a sus sub-hojas. Todas las hojas aparecen al mismo nivel. Cada entrada a una hoja es una tupla (R,O), donde R es el MBR y O es el objeto. Cada nodo intermedio es un tupla (R,P), donde R es el MBR que contiene los rectángulos hijos apuntados por P.

Lenguajes de consulta espacial.

Las bases de datos espaciales no tienen un conjunto de operadores que sirvan como elementos básicos para la evaluación de consultas ya que estas manejan un volumen extremadamente grande de objetos complejos no ordenados en una dimensión. Es por esto que existen algoritmos complejos para evaluar predicados espaciales. Las consultas son realizadas generalmente en SSQL (Spatial SQL), el cual introduce, mediante extensiones, los distintos conceptos del álgebra ROSE dentro del lenguaje SQL estándar, es decir, utiliza las cláusulas SELECT-FROM-WHERE para las tres operaciones en el álgebra relacional (proyección algebraica, producto cartesiano y selección). Las tres categorías fundamentales de consultas en un sistema de información espacial son:

·      Consultas exclusivamente de propiedades espaciales. Ejemplo: "Traer todos los pueblos que son cruzados por un río".

·      Consultas sobre propiedades no espaciales. Ejemplo: "Cuantas personas viven en Valdivia".

·      Consultas que combinan propiedades espaciales con no espaciales. Ej: "Traer todos los vecinos de un cuadra localizada en Puerto Varas"

En el lenguaje SSQL, el ejemplo del segundo punto se escribiría de la siguiente forma.

SELECT poblacion FROM ciudades WHERE nombre= "Valdivia"

EL otro tipo de consultas, para los datos obtenidos mediante rasterización, es llamado PSQL (Pictoral SQL) donde cada objeto espacial se extiende mediante un atributo loc (localización) el cual es referenciado en la cláusula SELECT para una salida gráfica y una cláusula específica para tratar relaciones espaciales. También se destaca en los lenguajes de modelado de la información espacial a GML que es una estructura para almacenar y compartir datos geográficos. Es una codificación del modelo geométrico de rasgo simple del OGC (Open Geospatial Consortium simple feature) usando XML. Un rasgo geográfico (geographic feature) es definido por el OGC como "una abstracción del fenómeno del mundo real, si este está asociado con una posición relativa a la Tierra". Por tanto, es posible hacer una representación del mundo real con un conjunto de rasgos. La especificación de un rasgo viene dada por sus propiedades, las que pueden pensarse definidas como un triple (nombre, tipo, valor). Si este rasgo es geográfico entonces la propiedad tendrá un valor geométrico. Por tanto, un rasgo simple del OGC es aquel cuya propiedad geométrica está restringida a una geometría simple en la que sus coordenadas estén definidas en dos dimensiones y en el caso de existir una curva, esta es sujeta a una interpolación lineal.

Aplicaciones.

Normalmente las bases de datos espaciales están asociadas a sistemas SIS (Sistemas de Información Estratégicos) o SIG (Sistemas de Información Geográfica). La información geográfica contiene una referencia territorial explicita como latitud y longitud o una referencia implícita como domicilio o código postal. Las referencias implícitas pueden ser derivadas de referencias explicitas mediante geocodificación. La información geográfica es a su vez el elemento diferenciador de un Sistema de Información Geográfica frente a otro tipo de Sistemas de Información; así, la particular naturaleza de este tipo de información contiene dos vertientes diferentes: por un lado está la vertiente espacial y por otro la vertiente temática de los datos. Mientras otros Sistemas de Información contienen sólo datos alfanuméricos (nombres, direcciones, números de cuenta, etc.), las bases de datos de un SIG integran además la delimitación espacial de cada uno de los objetos geográficos. Las implementaciones de bases de datos espaciales se dividen en tres campos.

SIG Puros.

Son bases de datos espaciales sin ninguna capa intermedia, realizan las operaciones de selección espacial de manera nativa. Son modulares, extensibles y normalmente con una interfaz amigable. Aunque también son capaces de generar una interfaz gráfica amigable para las bases de datos comunes, de tal manera de utilizar datos espaciales ya almacenados en estas tecnologías.

Ad-hoc.

Son sistemas desarrollados para alguna aplicación determinada, que utilizan un sistema de manejo de archivos propio y por ende un sistema de administración de datos propio. Es por eso que no son modulares, ni reutilizables. La ventaja es que son muy eficientes.

Bases de datos con extensiones para bases de datos espaciales.

Son sistemas de bases de datos normales a los cuales se les agrega una capa para el manejo de la geometría y hacer el "traspaso" desde datos comunes a datos espaciales transparente al usuario.

Data warehouse espacial.

Data Warehouse Espacial es una colección de datos orientados al tema, integrados, no volátiles, variantes en el tiempo y que añaden la geografía de los datos, para la toma de decisiones. Sin embargo la componente geográfica no es un dato agregado, sino que una dimensión o variable en la tecnología de la información, de tal manera que permita modelar todo el negocio como un ente holístico, y que a través de herramientas de procesamiento analítico en línea (OLAP), no solamente se posea un alto desempeño en consultas multidimensionales si no que adicionalmente se puedan visualizar espacialmente los resultados.

El Data Warehouse Espacial forma el corazón de un extensivo Sistema de Información Geográfica para la toma de decisiones, éste al igual que los SIG, permiten que un gran número de usuarios accedan a información integrada, a diferencia de un simple Data Warehouse que es orientado al tema, el Data Warehouse Espacial adicionalmente es Geo-Relacional, es decir que en estructuras relacionales combina e integra los datos espaciales con los datos descriptivos. Actualmente es Geo-Objetos, esto es que los elementos geográficos se manifiestan como objetos con todas sus propiedades y comportamientos, y que adicionalmente están almacenados en una única base de datos Objeto-Relacional. Los Data Warehouse Espaciales son aplicaciones basadas en un alto desempeño de las bases de datos, que utilizan arquitecturas Cliente-Servidor para integrar diversos datos en tiempo real. Mientras los Data Warehouse trabajan con muchos tipos y dimensiones de datos, muchos de los cuales no referencian ubicación espacial, a pesar de poseerla intrínsecamente, y sabiendo que un 80% de los datos poseen representación y ubicación en el espacio, en los Data Warehouse Espaciales, la variable geográfica desempeña un papel importante en la base de información para la construcción del análisis, y de igual manera que para un Data Warehouse, la variable tiempo es imprescindible en los análisis, para los Data Warehouse Espaciales la variable geográfica debe ser almacenada directamente en ella.

Data mining espacial.

El Data mining espacial es utilizado para extraer conocimiento interesante y regular. Sus métodos pueden ser usados para entender los datos espaciales, descubrir relaciones entre datos espaciales y no espaciales, reorganizar los datos en bases de datos espaciales y determinar sus características generales de manera simple y concisa.

Métodos de Data mining espacial.

·      Basados en generalización: requieren la implementación de jerarquías de conceptos, en el caso de las base de datos espaciales estas jerarquías pueden ser temáticas ó espaciales. Una jerarquía temática puede ser ejemplificada al generalizar mango y piña a frutas. Una jerarquía espacial puede ser ejemplificada generalizando varios puntos en un mapa como una región y un grupo de regiones como un país.

·      Reconocimiento de patrones: pueden ser usados para realizar reconocimientos y categorizaciones automáticas de fotografías, imágenes, y textos, entre otros.

·      Agrupamientos: Son utilizados para crear agrupaciones o asociaciones de datos, cuando en estos existan nociones de similaridad (por ejemplo, distancia Euclidiana).

·      Exploración de asociaciones espaciales: permiten descubrir reglas de asociación espaciales, esto es, reglas que asocien uno ó más objetos espaciales con otro ú otros objetos espaciales.

·      Aproximación y agregación: permiten descubrir conocimiento en base a las características representativas del conjunto de datos.

Base de datos.

Una base de datos es un conjunto de datos que pertenecen al mismo contexto almacenados sistemáticamente para su uso posterior. En este sentido, una biblioteca puede considerarse una base de datos compuesta en su mayoría por documentos y textos impresos en papel e indexados para su consulta.

En la actualidad, y gracias al desarrollo tecnológico de campos como la informática y la electrónica, la mayoría de las bases de datos tienen formato electrónico, que ofrece un amplio rango de soluciones al problema de almacenar datos.

En informática existen los sistemas gestores de bases de datos (SGBD), que permiten almacenar y posteriormente acceder a los datos de forma rápida y estructurada. Las propiedades de los sistemas gestores de bases de datos se estudian en informática.

Las aplicaciones más usuales son para la gestión de empresas e instituciones públicas. También son ampliamente utilizadas en entornos científicos con el objeto de almacenar la información experimental.

Aunque las bases de datos pueden contener muchos tipos de datos, algunos de ellos se encuentran protegidos por las leyes de varios países. Por ejemplo en España, los datos personales se encuentran protegidos por la Ley Orgánica de Protección de Datos de Carácter Personal (LOPD).

Tipos de bases de datos.

Las bases de datos pueden clasificarse de varias maneras, de acuerdo al criterio elegido para su clasificación:

Según la variabilidad de los datos almacenados.

Bases de datos estáticas.

Éstas son bases de datos de sólo lectura, utilizadas primordialmente para almacenar datos históricos que posteriormente se pueden utilizar para estudiar el comportamiento de un conjunto de datos a través del tiempo, realizar proyecciones y tomar decisiones.

Bases de datos dinámicas.

Éstas son bases de datos donde la información almacenada se modifica con el tiempo, permitiendo operaciones como actualización y adición de datos, además de las operaciones fundamentales de consulta.

Según el contenido.

Bases de datos bibliográficas.

Solo contienen un surrogante (representante) de la fuente primaria, que permite localizarla. Un registro típico de una base de datos bibliográfica contiene información sobre el autor, fecha de publicación, editorial, título, edición, de una determinada publicación, etc. Puede contener un resúmen o extracto de la publicación original, pero nunca el texto completo, porque sino estaríamos en presencia de una base de datos a texto completo (o de fuentes primarias).

Bases de datos numéricas.

Como su nombre lo indica, el contenido son cifras o números. Por ejemplo, una colección de resultados de análisis de laboratorio.

Bases de datos de texto completo.

Almacenan las fuentes primarias, como por ejemplo, todo el contenido de todas las ediciones de una colección de revistas científicas.

Directorios.

Un ejemplo son las guías telefónicas en formato electrónico.

Banco de imágenes, audio, video, multimedia, etc.

Como su nombre lo indica, almacenan información en distintos formatos.

Bases de datos o "bibliotecas" de información Biológica.

Son bases de datos que almacenan diferentes tipos de información proveniente de las ciencias de la vida o médicas. Se pueden considerar en varios subtipos:

·      Aquellas que almacenan secuencias de nucleótidos o proteinas.

·      Las bases de datos de rutas metabólicas.

·      Bases de datos de estructura, comprende los registros de datos experimentales sobre estructuras 3D de biomoléculas.

·      Bases de datos clínicas.

·      Bases de datos bibliográficas (biológicas).

Modelos de bases de datos.

Además de la clasificación por la función de las bases de datos, éstas también se pueden clasificar de acuerdo a su modelo de administración de datos.

Un modelo de datos es básicamente una "descripción" de algo conocido como contenedor de datos (algo en donde se guarda la información), así como de los métodos para almacenar y recuperar información de esos contenedores. Los modelos de datos no son cosas físicas: son abstracciones que permiten la implementación de un sistema eficiente de base de datos; por lo general se refieren a algoritmos, y conceptos matemáticos.

Algunos modelos con frecuencia utilizados en las bases de datos:

Bases de datos jerárquicas

Éstas son bases de datos que, como su nombre indica, almacenan su información en una estructura jerárquica. En este modelo los datos se organizan en una forma similar a un árbol (visto al revés), en donde un nodo padre de información puede tener varios hijos. El nodo que no tiene padres es llamado raíz, y a los nodos que no tienen hijos se los conoce como hojas.

Una de las principales limitaciones de este modelo es su incapacidad de representar eficientemente la redundancia de datos.

Bases de datos de red.

Éste es un modelo ligeramente distinto del jerárquico; su diferencia fundamental es la modificación del concepto de nodo: se permite que un mismo nodo tenga varios padres (posibilidad no permitida en el modelo jerárquico).

Fue una gran mejora con respecto al modelo jerárquico, ya que ofrecía una solución eficiente al problema de redundancia de datos; pero, aun así, la dificultad que significa administrar la información en una base de datos de red ha significado que sea un modelo utilizado en su mayoría por programadores más que por usuarios finales.

Bases de datos relacionales.

Éste es el modelo más utilizado en la actualidad para modelar problemas reales y administrar datos dinámicamente. Tras ser postulados sus fundamentos en 1970 por Edgar Frank Codd, de los laboratorios IBM en San José (California), no tardó en consolidarse como un nuevo paradigma en los modelos de base de datos. Su idea fundamental es el uso de "relaciones". Estas relaciones podrían considerarse en forma lógica como conjuntos de datos llamados "tuplas". Pese a que ésta es la teoría de las bases de datos relacionales creadas por Edgar Frank Codd, la mayoría de las veces se conceptualiza de una manera más fácil de imaginar. Esto es pensando en cada relación como si fuese una tabla que está compuesta por registros (las filas de una tabla), que representarían las tuplas, y campos (las columnas de una tabla).

En este modelo, el lugar y la forma en que se almacenen los datos no tienen relevancia (a diferencia de otros modelos como el jerárquico y el de red). Esto tiene la considerable ventaja de que es más fácil de entender y de utilizar para un usuario esporádico de la base de datos. La información puede ser recuperada o almacenada mediante "consultas" que ofrecen una amplia flexibilidad y poder para administrar la información.

El lenguaje más habitual para construir las consultas a bases de datos relacionales es SQL, Structured Query Language o Lenguaje Estructurado de Consultas, un estándar implementado por los principales motores o sistemas de gestión de bases de datos relacionales.

Durante su diseño, una base de datos relacional pasa por un proceso al que se le conoce como normalización de una base de datos.

Durante los años '80 (1980-1989) la aparición de dBASE produjo una revolución en los lenguajes de programación y sistemas de administración de datos. Aunque nunca debe olvidarse que dBase no utilizaba SQL como lenguaje base para su gestión.

Bases de datos orientadas a objetos.

Este modelo, bastante reciente, y propio de los modelos informáticos orientados a objetos, trata de almacenar en la base de datos los objetos completos (estado y comportamiento).

Una base de datos orientada a objetos es una base de datos que incorpora todos los conceptos importantes del paradigma de objetos:

·      Encapsulación.- Propiedad que permite ocultar la información al resto de los objetos, impidiendo así accesos incorrectos o conflictos.

·      Herencia.- Propiedad a través de la cual los objetos heredan comportamiento dentro de una jerarquía de clases.

·      Polimorfismo.- Propiedad de una operación mediante la cual puede ser aplicada a distintos tipos de objetos.

En bases de datos orientadas a objetos, los usuarios pueden definir operaciones sobre los datos como parte de la definición de la base de datos. Una operación (llamada función) se especifica en dos partes. La interfaz (o signatura) de una operación incluye el nombre de la operación y los tipos de datos de sus argumentos (o parámetros). La implementación (o método) de la operación se especifica separadamente y puede modificarse sin afectar la interfaz. Los programas de aplicación de los usuarios pueden operar sobre los datos invocando a dichas operaciones a través de sus nombres y argumentos, sea cual sea la forma en la que se han implementado. Esto podría denominarse independencia entre programas y operaciones.

Se está trabajando en SQL3, que es el estándar de SQL92 ampliado, que soportará los nuevos conceptos orientados a objetos y mantendría compatibilidad con SQL92.

Bases de datos documentales.

Permiten la indexación a texto completo y en líneas generales realizar búsquedas más potentes.

Gestión de bases de datos centralizada.

El sistema funciona alrededor de un solo punto. Ejemplo: bancos, cadenas de hoteles.

Gestión de bases de datos distribuida.

La base de datos está almacenada en varias computadoras conectadas en red. Surgen debido a la existencia física de organismos descentralizados. Esto les da la capacidad de unir las bases de datos de cada localidad y acceder así a distintas universidades, sucursales de tiendas, etc.