Búsqueda y Gestión de la Información y Recursos Multimedia

miércoles, 20 de abril de 2016

Papel Que Desarrolla el Business Intelligence En Las Empresas.

La habilidad de transformación de datos a información y ésta a su vez en conocimiento de forma que se pueda optimizar el proceso de tomas en los negocios es la que conocemos como Business Intelligence.

Los métodos y tecnologías utilizados por el Business Intelligence permiten depurar, reunir y transformar los datos de los sistemas transaccionales e información desestructurada en información estructurada, para su explotación directa (reporting...) o para su convertirlo en conocimiento, para dar soporte a la toma de decisiones sobre el negocio.

Esta estrategia genera una ventaja de competitiva, que proporciona soluciones a cualquier tipo de problemas de negocio, como podría ser la entrada al mercado.

http://qlik-blog-mexico.com/wp-content/uploads/2016/02/business-intelligence-2.jpg

Business Intelligence tiene unos productos destacables en la actualidad:

Cuadro de Mando Integrales: Es una herramienta usada para controlar la empresa permitiendo establecer los objetivos que tiene la empresa. Además se puede considerar como una aplicación que facilita la expresión de los objetivos e iniciativas que se deben de llevar a cabo para cumplir la estrategia. A diferencia de los dos siguientes, éste se enfoca más en la dirección departamental, los responsables de la organización utilizan este modelo como mapa para seleccionar unos indicadores del Cuadro de Mando Integrales.

Cuadro de Mando Operativo controla el seguimiento de las variables operativas pertenecientes a áreas o departamentos específicos de la empresa.

Cuadro de Mando Integral representa la ejecución estratégica desde la Dirección General. Utiliza indicadores tanto estratégicos como no. Los objetivos estratégicos se organizan en cuatro áreas o perspectivas.

Perspectiva financiera, como su nombre dice se centra en la visión de los accionistas y mide la creación de valor empresarial. Crea valor para la sociedad con objetivos más relevantes para tener ánimo de lucro.

Perspectiva del cliente, empatiza con los compradores haciendo asequible los productos siendo a la vez innovadores para llamar la atención sobre otros productos del mercado.

Perspectiva interna, enfocada a la empresa compite en coste, productividad, calidad... El éxito conseguido en esta perspectiva interna afecta también a otras.

Perspectiva de aprendizaje, saber cuándo es el mejor momento para invertir, y más por los tiempos económicos por los que estamos pasando actualmente, adquiriendo mayor riesgo de capital.

http://www.ifp.es/system/files/styles/contenido_post/private/posts/istock_000022514402_medium.jpg?itok=ur0tZd6z

Sistemas de Soporte a la decisión: sirve principalmente para poder analizar los datos de una organización. Este sistema es de los más representativos del Business Intelligence pues resuelven en poco tiempo los problemas de gestión. Algunas de las características más importantes son:

Informes dinámicos, flexibles e interactivos para que el usuario que lo vaya a utilizar pueda adaptarse al programa con su propio formato, ya que no está ninguno impuesto.

No requiere conocimientos muy técnicos facilitando la sencillez del aprendizaje del programa para poder ser utilizado de forma clara y rápida.

Rapidez en el tiempo de respuesta son bases de datos optimizadas para el análisis de grandes volúmenes de información.

Cada usuario dispone de información adecuada a su perfil cada usuario tiene acceso sólo a la parte que le toca, para que no pueda interferir en el programa corrompiéndolo.

http://blogs-images.forbes.com/brentbeshore/files/2014/12/shutterstock_156325400.jpg

Sistemas de Información Ejecutiva: proporciona a los gerentes de una forma sencilla el acceso a la información interna y externa de su propia compañía, relevante para sus factores clave del éxito.

Dicho sistema del Business Intelligence tiene como finalidad proporcionar al ejecutivo toda disposición del estado de los indicadores de negocio que afectan al momento, la vez que permite analizar aquellos que no cumplen los requisitos. Muestra las diferentes áreas de negocio de una forma rápida e intuitiva con ayuda de sus interfaces gráficas.

Además de los productos que hemos visto anteriormente tiene unos principales componentes de orígenes en la actualidad:

Datamart: base de datos departamental que se caracteriza por trabajar el almacenamiento de los datos para analizar la información detallada desde todas las posibles perspectivas que afectan a los procesos de dicho departamento. Este a su vez se divide en dos:

Datamart OLAP: basado en cubos OLAP que se construyen mediante la agregación según los requisitos, dimensiones...

Datamart OLTP: destacado por mejorar el rendimiento aprovechando las características de las áreas de la empresa.

Datawarehouse: constituida por una base de datos que integra y depura información de varias o única fuente, para luego procesar dicha información permitiendo un análisis desde infinidad de perspectivas y con grandes velocidades de respuesta. Da una solución coherente a los problemas de la empresa, es lo que hace más fiable al Business Intelligence. Su truco es ordenar la información de forma homogénea y fiable, permitiendo la consulta y tratamiento jerarquizado de la misma.

Se caracteriza por ser: integrado, temático, histórico y no volátil. Estos rasgos hacen que Datawarehouse pueda hacer el proceso ETL (Extracción de la información; Transformación , limpieza, depuración y agrupación de la información; Load, organización y actualización de los datos y metadatos en la base de datos)

http://www.esan.edu.pe/apuntes-empresariales/2015/06/18/Data_Warehouse_Mart_figura_principal.jpg

Los sistemas y componentes del Business Intelligence están optimizados para preguntar y divulgar sobre datos. Los procesos ETL que complementan al Business Intelligence tiene que traducir de uno o varios sistemas operacionales normalizados e independientes.

Para terminar, el Business Intelligence permite:

Observar qué es lo que está ocurriendo.
Comprender por qué ocurre.
Predecir qué es lo que sucederá.
Colaborar para conocer qué función debería de desempeñar el equipo.
Decidir el camino que se debe de seguir.

Bibliografía:
Transparencias de clase
http://www.sinnexus.com/business_intelligence/
http://www.captio.net/blog/el-papel-del-analista-en-la-inteligencia-empresarial
http://www.pymesyautonomos.com/tecnologia/que-es-la-inteligencia-de-negocios-business-intelligence
http://www.sinnexus.com/business_intelligence/cuadro_mando_integral.aspx
http://www.sinnexus.com/business_intelligence/sistemas_soporte_decisiones.aspx
http://www.sinnexus.com/business_intelligence/sistemas_informacion_ejecutiva.aspx
http://www.sinnexus.com/business_intelligence/datamart.aspx
http://www.sinnexus.com/business_intelligence/datawarehouse.aspx

martes, 12 de abril de 2016

Recuperación De La Información

La recuperación de la información comienza cuando a un usuario necesita saber algo muy concreto sobre un tema ("solicitud de búsqueda de la información"). Dicha recuperación consiste en proporcionar información importante y precisa al usuario previamente almacenada mediante herramientas a las cuales se puede acceder mediante ecuaciones de búsqueda para poder satisfacer la búsqueda del usuario.

Este proceso se lleva a cabo mediante consultas a la base de datos donde está almacenada la información estructurada mediante un lenguaje adaptado para que cualquier persona que busque encuentre lo que busque. Para ello es imprescindible utilizar elementos clave que permiten hacer una búsqueda precisa, como son:

Índices.

Palabras clave o tesauros.

fenómenos como: ruido y silencio documental.

Dependiendo de la búsqueda que realice el usuario puede obtener mucha información o todo lo contrario, esto es lo que se llama ruido o silencio documental.

Para acceder a una información previamente almacenada se utilizan componentes esenciales:

Documentos estructurados: proceso que utiliza herramientas de control de términos e indización.
Bases de datos: primero analiza la consulta del usuario para saber el idioma que habla y saber las ecuaciones que debería de utilizar para aproximarse a dicha consulta.

Las principales herramientas que se utilizan para la recuperación de la información:

Base de Datos: explicado en esta entrada http://bygmultimediauahedm.blogspot.com.es/2016/03/sistemas-de-almacenamiento-actuales-y.html. La base de datos utiliza a su vez:

Buscadores: los cuales permiten localizar y recuperar la información almacenada en internet.

Directorios: son una serie de istas ordenadas que nos permiten acceder a la información de una forma clara y ordenada.

Metabuscadores: destacados por buscar información en varias bases de datos.

Buscadores selectivos: buscan la información en una base de datos especializada en una materia específica.

Agentes inteligentes: localizan la información de una forma automática predeterminando anteriormente un perfil de búsqueda y dónde debe de hacerla.

Lenguajes de indización y control terminológico:

Índices: que son términos normalizados recopilados en una listaque representan un recurso.

Índices de materias: ordenados según las materias que trata la base de datos.

Índice alfabético: ordenados alfabéticamente.

Índice KWIC: se ordena mediante las palabras clave del documento.

Índice KWOC: varía respecto al índice KWIC en el que las palabras clave se ordenan al principio en línea separada.

Palabras clave: término que precisa información sobre un tema.

Meta Keywords: se utilizan para buscar las palabras clave de cada página web, es por eso que las páginas web deben de estar bien etiquetadas.

Tesauros: es un listado de términos que se enlazan por su significado semántico, ordenados jerárquicamente. Estos pueden estar relacionados de tres formas:

Jerárquicamente: cuando una palabra es más importante que otra.

Asociativamente: indican que los términos guardan alguna relación.

Sinonímicamente: entre dos términos que significan lo mismo utiliza el término que sea más correcto

Lenguajes de interrogación y Ecuaciones de Búsqueda: Adapta el lenguaje del usuario a otro que pueda ser leído por la base de datos. Se pueden utilizar varios procedimientos de trabajo:

Plantear el tema desde varios puntos de vista.

Determinar que se sabe el tema.

Formular la búsqueda mediante palabras clave o traducción de palabras clave a otros lenguajes.

Seleccionar herramientas de búsqueda (índices, motores, metabuscadores).

Aplicando las palabras clave en las herramientas de búsqueda seleccionadas.

Ecuaciones se utilizan para poder recuperar la información de una forma más eficaz, algunas ecuaciones son:

Truncamiento nos posibilita recuperar las formas que puede adoptar la raíz de un mismo término.

Operadores booleanos se utilizan para a ampliar o acotar la búsqueda.

"And" - Reduce
"Or" - Amplía
"Not" - Elimina

Delimitadores al igual que los booleanos se utilizan para ampliar o acotar la búsqueda.

" = " - Igual que.
" > "/ " < " - Mayor/menor que.
">=" / "<=" - Mayor/menor o igual que.

Webspirs un programa utilizado para consultar en bases de datos según el contenido que traten (Medicina, Educación, Lengua y Literatura ...)

Algunas Técnicas De Recuperación De La Información.

Sistemas de recuperación de lógica difusa se utiliza para establecer consultas cuando un usuario estándar introduce la búsqueda. Dicho sistema lo "traduce" para que se pueda buscar en las bases de datos omitiendo palabras muy comunes. (Como son los artículos ...)
Técnicas de ponderación de términos analiza los términos según la importancia y el valor que tiene en la consulta realizada.
Técnicas de clustering modelo probabilístico que agrupa los documentos según el orden de importancia que tengan.
Técnicas de stemming busca por el lexema de las palabras omitiendo los prefijos, postfijos ...

Calidad De La Recuperación.

Para que la recuperación de la información sea de calidad y no encuentre lo que el usuario no desea tiene unos criterios que ha de cumplirse antes de mostrar los resultados.
Uno de ellos es la consistencia, ésta clasifica su sistema con el lenguaje que se ha solicitado la búsqueda. Otro criterio es la exhaustividad es la cualidad de un sistema de información para poder recuperar los documentos relevantes. La relevancia es otro muy utilizado, que muestra a los documentos según el número de visitas que ha tenido dicho documento, este criterio se complementa con la precisión que coordina la ecuación con los documentos más relevantes.

Enlaces:
http://es.slideshare.net/sjaramillo1972/recuperacin-de-la-informacin
http://www.mariapinto.es/e-coms/busqueda-y-recuperacion-de-informacion/
http://www.mariapinto.es/e-coms/bibliotecas/
http://es.geocities.com/recupdeinformacion_ontologias/recuperacioninformacion.htm#suamrio
http://www.comp.lancs.ac.uk/computing/research/stemming/general/
http://eprints.rclis.org/5610/2/busquedapres.pdf
http://delta.cs.cinvestav.mx/~gmorales/ldifll/ldifll.html
http://bygmultimediauahedm.blogspot.com.es/2016/03/sistemas-de-almacenamiento-actuales-y.html

martes, 22 de marzo de 2016

Sistema De Búsqueda De Google

Muchos nos preguntamos cómo es que Google puede ser tan rápido en sus búsquedas y predecir lo que vas a buscar en cuestión de milisegundos.Para conocer cómo funciona Google debemos de conocer las principales herramientas ha utilizado y posteriormente se han cambiado o actualizado por otras más eficaces.

Crawler Googlebot y Google Spider: Google Spider/Bot es un programa que está en funcionamiento las veinticuatro horas del día buscando nuevas páginas webs para poder actualizar el contenido aunque no los registra oficialmente hasta que tenga peticiones. Sólo los recoge y los envía al Crawler que los guarda en su base de datos y los analiza.

Spider ----> Recoge.

Crawler ---->Analiza y almacena la página.

Esto quiere decir que si una página web no ha sido rastreada y analizada por el Crawler no aparecerá en resultados de búsqueda de Google.

Spider analiza las páginas que tienen en su índice y sigue sus links y de ese enlace a otra página que contiene otros links que llevan a otra página. Una vez que se rastrea una página Google realiza el proceso de indexación que ordena el índice según la importancia respecto a la palabras clave. Este proceso de indexación es lo que otorga calidad a las búsquedas de google, pues eliminando las "stopwords", que son aquellas palabras generales que no aportan a la búsqueda ("el, la, lo, las, en ...")

La rapidez de Google viene dada porque utiliza sus propios índices en vez de utilizar el internet.

El servidor donde se procesa la búsqueda del usuario es Google Query Processor. Lo primero que hace es pedir el índice de la multitud de páginas que ha rastreado que contienen las palabras clave de la búsqueda del usuario , una vez que tiene todas las páginas con las palabras clave Google utiliza dos herramientas para que la búsqueda sea rápida, pero no lo suficientemente eficaz; es decir,puede que no tenga calidad, que no sea justo lo que busca el usuario. Dichas herramientas son Algoritmo y Page Rank.

El Algoritmo de Google según las palabras clave de la búsqueda que haya solicitado el usuario, analiza si se encuentran en el título, en la propia URL de la página, si se repite muchas veces en dicha página... Pero esto no garantiza la buena calidad de la página, es por eso que después del algoritmo pasa al Page Rank.

Page Rank: es utilizado para la relevancia óptima del usuario, en una escala del uno al diez la puntúa, estas condiciones están dadas por el número de veces que el link de una página se comparte en otras páginas, y si es citado en webs importantes que tienen muchos usuarios aparecerá de las primeras.

Actualmente el funcionamiento interno de Google está establezido por Google Caffeine. Es un motor de búsqueda que hace índices más rápido, con más contenido, más eficaz, más sólido que el Spider. Junto al Google Caffeine se suma Google Mayday.

Google Mayday es un cambio del algoritmo utilizado anteriormente por Google que promociona los sitios más pequeños que merecen la pena, que son más eficaces y mejora la calidad. Esto ha perjudicado a las grandes páginas que no pueden actualizar todo el contenido que tienen, pero es algo necesario, pues el usuario que utiliza Google quiere encontrar lo más actual y de buena calidad que existe en la red.

Con esta nueva mejora el Page Rank ya no tiene tanto sentido, pues el mejor contenido no es necesariamente el enlace que más se ha compartido. Pero aun así Page Rank seguirá computando con menos frecuencia

CONCLUSIÓN:

¿Por qué Google es tan rápido?

Google no busca en Internet, busca en su índice que está constantemente actualizándose por el spider.

¿Cómo garantizar que las primeras entradas que presenta Google son de calidad?

Hace 10 años Google utilizaba su Algoritmo, el cual simplemente buscaba páginas que tuviesen las mismas palabras que escribía el usuario, y el Page Rank el cual cuanto más se compartía la URL de dicha página salía de las primeras.

Esto no garantizaba la calidad de que el resultado fuese lo que buscaba el usuario, fue por eso que se implantó el Google Mayday y el Google Caffeine ayudando a las páginas que realmente aportan información de buena calidad, sea conocida o no.

Enlaces solicitados:
https://support.google.com/adwords/answer/2454010?hl=es
https://support.google.com/adwords/answer/140351?hl=es
http://www.top-rankin.com/como-funciona-google/
http://www.top-rankin.com/que-es-google-caffeine/

martes, 8 de marzo de 2016

SISTEMAS DE ALMACENAMIENTO ACTUALES Y TENDENCIAS DEL FUTURO

La evolución de los sistemas de almacenamiento han evolucionado de una forma increíble, pues hemos pasado de utilizar disquetes a utilizar "la nube" de internet, la cual es mucho más eficaz que el disquete.

En este blog nos centraremos más en los sistemas de almacenamiento actuales, tanto físicos como virtuales. Personalmente aunque los virtuales se utilizan muchísimo, si son datos privados que no quieres que sean visto por cualquier otra persona te recomiendo usar los sistemas de almacenamiento físicos, pues a mi entender son más seguros, aunque te recomiendo guardar antes el archivo en varios sistemas físicos porque tienen más posibilidades de romperse o dejar de funcionar.

SISTEMAS DE ALMACENAMIENTO ACTUALES

MEMORIA RAM es la más utilizada actualmente, pues todos los dispositivos que utilizamos poseen dicha memoria. Dicha memoria permite ejecutar todo tipo de aplicaciones. Una de las memorias de almacenamiento aleatorio que se utilizó durante los 90 fue en Windows95 utilizando 16 MB, y en la actualidad es normal encontrar ordenadores entre 4 y 8 Gigabytes y en los móviles entre 1 y 2 Gigabytes.

CD's y DVD's son sistemas de almacenamiento que se siguen utilizando aunque existan sistemas mucho más avanzados. En la actualidad los podemos encontrar muy comunes en videojuegos, música, películas, aplicaciones o programas... (Aunque existan las ventas virtuales que se guardan automáticamente).

Existen varios tipos de CD's:

CD-ROM / DVD-ROM: lectora de CD/DVD.
CD-R / DVD-R: Grabadora de CD/DVD.
CD-RW / DVD-RW: Permite regrabar discos.

Actualmente los discos que más calidad aportan son Blue-ray Disc, pues en estos discos se pueden ver las imágentes en alta definición, teniendo más calidad de imagen que el DVD.

BASES DE DATOS es un conjunto almacenado de información en un soporte que la permite ser legible por el ordenador. Una de las principales razones por las que actualmente está siendo muy utilizada es porque es posible recopilar todo tipo de información.

Big Data es el proceso de recopilar grandes cantidades de datos y hacer un análisis instantáneo para encontrar información oculta...

Para explicar la definición de Big Data muchos recurren a la utilización de las cinco V's:

Volumen: capta y ordena toda la información.

Velocidad: otorga agilidad a la hora de ordenar datos.

Variedad: mezcla tipos de información.

Veracidad: herramientas que buscan y encuentran información sobre un dato.

Valor: aportan un valor a la sociedad. pues es innovador y crea competencia.

BASES DE DATOS ESTRUCTURADAS:

Formadas por registros que están estructurados en campos y gestionadas por una base de datos racional, capaz de realizar operaciones para datos dobre contabilidad, principalmente en empresas que no son muy grandes.

El Big Data en bases de datos estructurados actúan almacenando en tablas datos que poseen un formato y una longitud específicas, por ejemplo el número de personas que viven en Archidona.

BASES DE DATOS NO ESTRUCTURADAS:

Son datos que pueden estar semiestructurados o no estructurados. Los datos semi-estructurados poseen una organización interna que hace más sencillo de tratar y más rápido. Esto es una gran ventaja para los centros comerciales, pues usar una base de datos tradicional en empresas grandes sería muy complicado y llevaría mucho tiempo.

El Big Data en bases de datos no estructurados no puede almacenar en tablas datos que no tienen formato ni longitud. Como son los de tipo texto (Por ejemplo este blog, redes sociales) o los que no son de tipo texto (Vídeos, Imágenes...).

Frente a todas las ventajas que presenta Big Data existe un principal inconveniente que es la privacidad, pues no la única posibilidad de que no encuentren datos tuyos es porque existen tantos de los demás usuarios que los tuyos pueden pasar desapercibidos.

Un concepto a destacar de las bases de datos son los Metadatos. Es un dato sobre el dato, se utiliza para evitar un mal uso por los usuarios que no están familiarizados al mundo bibliotecario. Son un grupo de atributos que sirven para hallar la fuente de la que proviene.

Para consultar en las Bases de Datos se utilizá el lenguaje de consulta estructurado Structured Query Language (SQL). Se usa para consultar, eliminar o modificar datos en una Base de Datos, además de aclarar conceptos.

Las consultas son conocidas principalmente por recuperar los datos deseados de las tablas, pues gracias a ellas podemos filtrar los datos para obtener sólo unos registros específicos. Existen dos tipos de consultas:

Selección: hace que se muestren disponibles para el uso y recupera datos.
Acción: realizan una tarea con datos. Por ejemplo; crear nuevas tablas, eliminar o actualizar datos ...etc

Otro sistema de almacenamiento es la MEMORIA USB (PENDRIVE), creada por IBM en 1998. Actualmente es de los sistemas de almacenamientos más fáciles de encontrar en el bolsillo de cualquier persona, pues aún la nube de internet falla, y sin embargo un pendrive no necesita nada más que la conexión al ordenador. También existe el disco duro, donde caben muchísimos más datos, pero no es tán ligero como el pendrive.

El sistema de almacenamiento más innovador es LA NUBE. Donde podemos guardar todo tipo de ficheros siempre que tengamos conexión a internet. Además de guardarse de una forma muy rápida es la más cómoda de todas, yo personalmente recomiendo Dropbox, aunque siempre que subas ficheros a la nube debes de saber que un usuario con conocimientos avanzados puede copiar o robarte los ficheros subidos, pero normalmente no se suele dar este mal uso.

FUTURO DE LOS SISTEMAS DE ALMACENAMIENTO

Una investigación reciente de la empresa IBM ha estudiado que cada dieciocho meses los usuarios demandan el doble de capacidad, y que cada año los datos estructurados crecen un 32% y los no estructurados un 63%.

Marius Costache ,investigador rumano, descubrió con la física cuántica que modificando la orientación del electrón, el espín, entendido como una esfera. Al ser el electrón como una esfera éste podría orientarse en cualquier dirección y no sólo en las dos que conocemos atualmente. Es así como se podría almacenar muchísimos más datos o incluso almacenar infinitos datos.

SSD proviene de los términos Solid-State drive, este disco duro almacena datos y ayuda a tener un rendimiento de almacenamiento mejor que hace que el ordenador esté optimizado y funcione más rápido, proporciona mayor longevidad y menos tiempo de espera al realizar cualquier tipo de tarea con el ordenador. Es una mejora del disco HDD, y la diferencia se encuentra en su método de almacenamiento.

Dicho método explicado de una forma sencilla consiste en el almacenamiento de la información en bloques creados y cuando el ordenador quiere usarlo el SDD se lo entrega.

SSD tiene una desventaja, pues no en todos permite actualizar el sistema operativo del ordenador al que va integrado, es uno de los datos que tendrás que tener en cuenta cuando quieras comprar uno de estos.

También se está estudiando crear discos duros con ADN, con el que no se necesita electricidad para su funcionamiento. Aunque ya se ha demostrado que es un sistema rápido y eficaz el elevado coste que posee no saldría rentable; ya que los usuarios no lo comprarían. Otra desventaja es que el ADN no se puede reescribir, implicando a crear secuencias nuevas cada vez que se quieran añadir datos.

¿Qué nos espera el futuro?¿Veremos los avances actuales de almacenamiento ridículos ante los del futuro? Sólo queda esperar.

Enlaces:

https://es.wikipedia.org/wiki/Evoluci%C3%B3n_de_los_dispositivos_de_almacenamiento
http://www.mariapinto.es/e-coms/bases-de-datos/
http://www.ids-ac.com/index.php?option=com_content&view=article&id=20&Itemid=52
http://html.rincondelvago.com/base-de-datos_6.html
http://catedradatos.com.ar/2013/10/teorico-12-redes-el-lado-oscuro-de-los-datos/
http://mibloguel.com/big-data-significado-y-su-utilidad-en-la-sociedad/
http://www.sedic.es/autoformacion/metadatos/tema1.htm
http://www.toshibacenter.es/que-son-los-metadatos-para-que-sirven-los-metadatos/
http://es.slideshare.net/csalazarc/consultas-base-de-datos-en-sql
https://support.office.com/es-es/article/Conceptos-b%C3%A1sicos-sobre-bases-de-datos-a849ac16-07c7-4a31-9948-3c8c94a7c204
http://www.dell.com/learn/co/es/cobsdt1/sb360/sb-newsletter-3-2012-2
ftp://public.dhe.ibm.com/software/es/events/doc/start013/13/7-Tendencias-y-futuro-almacenamiento.pdf
http://www.elmundo.es/economia/2015/07/23/55b1280d22601d05068b459e.html
http://blogthinkbig.com/hdd-versus-ssd/
http://www.seagate.com/es/es/tech-insights/future-of-solid-state-storage-in-laptops-master-ti/
http://www.bbc.com/mundo/noticias/2013/01/130124_ventajas_archivar_documentos_adn
http://www.batanga.com/curiosidades/4187/cientificos-logran-utilizar-adn-para-almacenar-datos

miércoles, 24 de febrero de 2016

Los lenguajes de programación actuales.

Origen del lenguaje de programación.

El primer lenguaje de programación, según la mayoría de autores, se creó cuando Charles Babbage inventó su computadora (1822). El lenguaje que creó Babbage estaba formado por cambio de engranajes los cuales llevaban a cabo unos cálculos.

Posteriormente, inspirada en la computadora de Babbage, se construyó la computadora ENIAC, la cual sustituyó los engranajes por interruptores, la principal desventaja de ENIAC era que se tenía que reescribir el sistema completo por cada nuevo programa. Es por esta desventaja que en 1945 Von Neumann desarrolló una técnica que reducía las instrucciones complejas a unas más simples, dicha técnica es conocida con el nombre de Compartir-Programa. La computadora creada por Von Neumann utilizaba el lenguaje de código máquina.

En el año 1957 aparece el primer lenguaje de programación de alto nivel FORTRAN (Formula Translation). El lenguaje de programación se utiliza para que las personas podamos comunicar, informar al ordenador y así poder mandar instrucciones, FORTRAN fue utilizado principalmente para desarrollar cálculos matemáticos.

A partir de FORTRAN se crearon lenguajes de programación como Pascal (1968) y C (1972). Aunque se han creado más estos fueron los más importantes y de donde principalmente dervian los lenguajes de programación.

Evolución del lenguaje de programación:

Código máquina (0000111101010101)
Código ensamblador (LOAD I; ADD J ...)
Código alto nivel( K = I + J)
Código natural

El lenguaje ideal

Para que actualmente un lenguaje de programación sea un éxito debe de ser:

Multiuso
Portable
Popular
Entorno de trabajo amigable

Lenguajes de programación actuales.

Hoy en día existen pseudocódigos del lenguaje de programación que tienen como principal finalidad facilitar la complejidad a través de la simplificación de complejos algoritmos. Esto ayudará a entender la parte lógica de la programación, para empezar en este lenguaje. Estos pseudolenguajes son utilizados en clases para principiantes como podría ser Tecnología, Programación y Robótica en la ESO.

Los lenguajes de programación debe: desarrollar un mantenimiento, que funcionen de forma óptima y que tengan un rendimiento apropiado.

Según "TIOBE Index for February 2016" los lenguajes de programación más utilizados actualmente son:

Java pues es uno de los lenguajes actuales que sirve para la construcción de back-ends utilizados en aplicaciones de web de empresa. Esto facilita escalar las aplicaciones web para un gran número de usuarios. Android utilizó como lenguaje principal en sus primeras aplicaciones para teléfonos y tablets.
Por esto sabemos que Java seguirá siendo uno de los lenguajes más importantes en el futuro pues al facilitar la escala de las aplicaciones hace más sencillo ,más rápido y con una buena eficacia de su función. Además Java ofrece totalmente gratis sus servicios esenciales para programar, su interfaz permite hacer infinidad de cosas.

Una de las características más destacables de Java es su compatibilidad regresiva, ésta capacidad de retrocompatibilidad no la poseen los demás lenguajes y es una verdadera ventaja.

C#,C++,C:

C. De este grupo de lenguajes de programación es el más sencillo de entender, no está enlazado a un sistema operativo concreto, pues la principal función de este lenguaje es ser fácil de entender para aprender a programar.

C es un lenguaje que seguirá actualmente usándose por ser uno de los principales lenguajes bajos, ayudando a tener un concepto más amplio sobre los ordenadores. Es esencial para modificar los drivers y sistemas operativos.

C++. Muchos lo consideran como una extensión de programación C que permite manipular objetos, es capaz de reunir objetos de bajo nivel con abstracciones de alto nivel de productividad. C++ es un lenguaje versátil, ofrece gran rendimiento y se puede utilizar en varias plataformas. Los programas como Autodesk, la mayoría de videojuegos y Photoshop utilizan este lenguaje.
C# es el lenguaje más usado para crear software de sistemas. C# se creó para facilitar, en su momento, el aprendizaje del lenguajes de programación, además de que es el lenguaje principal para plataformas de Microsoft.

Python si no es el lenguaje actual más sencillo es del top tres de los más sencillos. Este lenguaje es el primer y único lenguaje de programación que he utilizado y es muy fácil de entender. Gracias a su sencillez nos facilita hacer programas más difíciles y ahorrar mucho tiempo comparado con los anteriores, pero no gana la eficacia que tiene Java o C. Dicho ahorro de tiempo es importante para el futuro, pues es lo que buscan los programadores.

PHP es actualmente un lenguaje esencial para utilizar bases de datos además del lenguaje PHP, pues hoy en día es necesario para crear aplicaciones webs, además de estar en la base de datos de nuevas webs. Es un lenguaje que utiliza código abierto que puede combinarse en HTML. Dicho lenguaje se utiliza para páginas que son dinámicas (la estáticas son aquellas que la página siempre permanece igual, es decir, el contenido es el mismo siempre).

En quinta posición de los lenguajes actuales más utilizados he optado por poner estos tres juntos:

Visual Basic.Net es otro de los lenguajes más utilizados, pues al igual que PHP sirve para construir páginas web, y también sirve para ejecutar e instalar servicios Web. Las principales ventajas que posee Visual Basic.Net es que es extensible, sencillo de utilizar para desarrolladores y cumple un diseño que utiliza modelos de aplicaciones. Otra mejora es que posee un soporte enfocado a objetos, tiene recolector de basura y crea servicios Web rápidamente.

Perl sus principales rasgos a destacar es la cyberseguridad y que es fácilmente extensible. Éste sirve para para procesar enormes cantidades de datos, buscar algún patrón en dichos datos, manejar conexiones de redes...

Perl no es considerado como compilador pero tampoco como un intérprete, está en un punto intermedio entre estos dos.

SmartGWT es un desarrollo de interfaces Web. Permite recargar una parte específica de una página, ya que antiguamente no se podía recargar solamente una parte.

El desarrollo de los lenguajes de programación ha evolucionado de una forma brutal, quién sabe si en un futuro los lenguajes más importantes que están siendo utilizados hoy en día serán ridículos ante los lenguajes del futuro.

Documentación de apoyo:

www.elmundo.es/madrid/2015/09/02/55e62d89e2704efc378b45aa.html
http://www.larevistainformatica.com/historia-lenguajes-programacion.
http://www.tiobe.com/index.php/tiobe_index
http://www.tecnolatinos.com/los-5-lenguajes-de-programacion-mas-populares/
http://www.muycomputerpro.com/2015/04/13/lenguaje-programacion-2015
http://aprenderaprogramar.es/index.php?option=com_content&view=article&id=492:ique-es-php-y-ipara-que-sirve-un-potente-lenguaje-de-programacion-para-crear-paginas-web-cu00803b&catid=70:tutorial-basico-programador-web-php-desde-cero&Itemid=193
http://kataix.umag.cl/~ruribe/Utilidades/Tutorial%20de%20Perl.pdf
https://jmontenegro.files.wordpress.com/2008/08/curso-de-visual-basic-net.pdf
http://gwolf.org/content/1-introducci-n
http://kataix.umag.cl/~ruribe/Utilidades/Tutorial%20de%20Perl.pdf
http://nideaderedes.urlansoft.com/2006/12/02/diez-razones-para-por-las-que-un-programador-deberia-aprender-c/
http://expressionhost.com/ifacebook/global/Razones_para_aprender_JAVA.pdf
http://www.tufuncion.com/diferentes-lenguajes-programacion

sábado, 13 de febrero de 2016

Información y documentación.

Información y comunicación en el contexto de la documentación.

Con los datos se monta la información y con ésta misma el conocimiento que se adquiere de la información.

Hoy en día podemos mucha gente comparte información (escrita, oral, audiovisual…) en Internet, ya sea objetiva o subjetiva, esto imposibilita asimilar todos los conceptos, además de que no por haber más quiere decir que mejore la calidad o que sea información correcta. Las personas tenemos mucha libertad en Internet, pero aun así existen restricciones de acceso en algunas páginas.

En la actualidad el Internet es la principal fuente de información que como hemos dicho antes la calidad no siempre es buena, es decir, a veces los primeros enlaces que aparecen en los buscadores son elaborados por gente que realmente no tiene los requisitos necesarios para poder hablar correctamente de la información que transmite pudiendo equivocar a los espectadores que les llega dicha información.

Las ciencias de la documentación.

Consiste en observar y razonar cómo sacar el máximo partido a la información que se quiere compartir para que llegue a un grupo amplio de individuos. Algunas de las ciencias de la documentación son: Informática, Tele-documentación, Bibliometría, Terminología científica, Bibliografía, Biblioteconomía, Ciencia cognitiva, Ciencias de la comunicación y la Inteligencia Artificial.

Para que se pueda transmitir al público la documentación tiene que ser inteligible por cualquier persona ayudándose de acotaciones, explicaciones, o el significado de aquellas palabras o proposiciones que pueden complicar al lector.

La informática es el “Conjunto de conocimientos científicos y técnicas que hacen posible el tratamiento automático de la información por medio de computadoras.” (Diccionario de la RAE).

El día 10 de Febrero de 1996 Gary Kaspárov, (ruso campeón del mundo de ajedrez de los años 1985 al 2000) se enfrentó a una partida de ajedrez contra la supercomputadora Deep Blue creada por IBM resultando perdedor, siendo la primera vez que una máquina ganó al ser humano. Según narraba «The Washington Post» Un error de programación en el ordenador causó que hiciese un movimiento sin sentido despistando al maestro del ajedrez Kapárov.

Al siguiente año se volvieron a enfrentar y el ordenador con su base de datos que contenía aproximadamente un millón de partidas almacenadas desarrolladas por técnicos en el ajedrez volvió a ganar. Gary Kaspárov defendió que la máquina había hecho trampas en la partida ya que IBM se negó a volver a repetir el reto y a mostrarle el informe detallado de dicha partida. (Información apoyada del periódico ABC www.abc.es/archivo/20140501/abci-deep-blue-kasparov-201404301111.html)

Esto nos demuestra que la inteligencia artificial es bastante más eficaz, a la hora de realizar instrucciones, frente a la inteligencia de una persona.

La teledocumentación nos permite acceder a través de medios telemáticos a la información almacenada en internet.

La Bibliometría es la aplicación de conocimientos (matemáticos y estadísticos) que han sido aceptados por científicos importantes que sirven de ayuda, de apoyo a nuevas personas para poder resolver hipótesis, partiendo de estos conocimientos. Esto deberá de evolucionar para que pueda ser entendido por el mayor grupo de personas posible.

La Terminología Científica son términos muy específicos en el ámbito de la ciencia que mediante una definición aclaran al lector aquellos puntos que pueden dar lugar a equívocos.

La Bibliografía es la “Relación de textos, procedentes de diversos soportes, utilizados como fuente documental” (Diccionario de la RAE).También podemos destacar las referencias sobre la documentación que uno escribe, pues cuando alguien habla de un tema es imposible que pueda conocerlo si no lo ha leído o estudiado antes, las referencias además ayudan al receptor a buscar más información sobre el tema que has hablado y mejora la calidad del trabajo.

La Biblioteconomía puede ser considerada como una ciencia o como conocimientos prácticos, formada por un conjunto de normas y una organización de la biblioteca ordenada por la experiencia. (http://www.ecured.cu/Biblioteconom%C3%ADa)

Ciencia Cognitiva es un conocimiento hallado mediante investigaciones empíricas que plantean tres niveles para acceder a la información: Funciones (emoción, percepción, memoria, imaginación…); representaciones del mundo; y características del conocimiento derivadas de la investigación cognitiva. (De la mente al conocimiento mediante la ciencia cognitiva – José Luis Díaz)

Ciencias de la comunicación son una agrupación de disciplinas que observan los fenómenos sociales relacionados con la comunicación, así como los medios que se utilizan para transmitir algo, ya sea oral, escrito, por gestos… (www.solociencia.net/que-es-ciencias-de-la-comunicacion)

La Inteligencia Artificial es una rama de la computación que relaciona un fenómeno natural con una analogía artificial a través de programas de computador. (bvs.sld.cu/revistas/san/vol2_2_98/san15298.htm)

Tipología de documentos.

Documentos como soporte físico en el que está la información (papel, disco,…) es importante los parámetros de la legalidad de dichos documentos.

No tiene nada que ver el contenido de un documento con su soporte físico. Se dividen en:

Textuales e impresos (Soporte papel)
Micrógrafos (Microfilm)
Audiovisuales (Vídeo, Películas)
Magnéticos (Discos y cinta magnética)
Ópticos (CD-ROM)
Electrónicos (Bases de datos online)

Por ejemplo los servidores de google tienen prácticamente toda nuestra información de documentos electrónicos en sus servidores.

Google puede leer todo lo que escribimos en gmail, pero además Google cede al Gobierno de los Estados Unidos información cuando se investigan casos que afectan a la seguridad de la nación. David Drummond, jefe legal de Google, explicó que cuando reciben una orden judicial la información la transmiten a través del sistema de transferencia FTP asegurado.Pero tanto Google como Facebook como han aclarado en los periódicos “The Guardian” y “The Washington Post” han aclarado que no facilitan el acceso directo al Gobierno y sólo ceden información cuando se solicita mediante una orden judicial. (Información extraída de www.univision.com/noticias/noticias-de-eeuu/google-cuenta-como-cede-informacion-al-gobierno-de-eeuu) Como es de esperar Google no dice dónde se encuentran sus servidores para poder guardar ciertos derechos y privacidad del usuario, tal es el caso que se especula que Google está estudiando alguna forma de poder llevar sus servidores al mar, además las naves marítimas recibirían energía a partir del movimiento natural de las olas. (Información extraída de tecnologia.elpais.com/tecnologia/2008/09/17/actualidad/1221640080_850215.html)

Cuando tenemos que guardar algún contenido debemos de pensar en los parámetros de legalidad. Por ejemplo el papel de FAX no tiene validez legal porque la tinta se borraba y no cumplía los requisitos del período de tiempo mínimo que tiene que conservarse un documento.

Cadena documental.

Es cómo se recogen los documentos para que sean accesibles y eficaces, y esto se consigue con las palabras clave.

Por ejemplo: cuando buscamos algo en Google, lo que escribimos son las palabras clave que ha etiquetado el autor de dicha página, o de su espacio en dicha página.

Esto se consigue con las Bibliotecas de la cadena documental, las cuales se dividen en:

Selección. Recoge los documentos que merecen ser registrados y transmitidos al usuario.

Análisis. Son operaciones que se llevan a cabp àra transmitir el contenido de una forma diferente a la habitual. Las operaciones son: descripción bibliográfica, palabras clave y resumen.

Búsqueda. Procedimientos, ya sean manuales o electrónicos para obtener del fondo bibliográfico los documentos que satisfagan las necesidades de la búsqueda que realice el usuario.

El posicionamiento SEO (Search Engine Optimization) Trata la facilidad de que los buscadores encuentren y reconozcan como sitios de web de confianza y que tenga la calidad definida como el transmisor las necesita. (http://www.yoseomarketing.com/blog/que-es-el-posicionamiento-seo-para-que-sirve/)

Difusión. Difunde la información que responde a las preocupaciones informativas mediante una serie de servicios (Búsqueda de documentos, DSI, Servicios de consulta, SOD, Archivos de prensa…)

Fuentes de información.

De las fuentes de información podemos destacar dos:

Literatura gris. Son publicaciones que no se distribuyen a través de los canales convencionales (editoriales, librerías…) y es por ello que son difíciles de identificar y obtener.

Bibliotecas depositarias. Son bibliotecas científicas cuyo objetivo es conservar documentos con la intención de difundir todos los documentos científicos.

Páginas

miércoles, 20 de abril de 2016

Papel Que Desarrolla el Business Intelligence En Las Empresas.

martes, 12 de abril de 2016

Recuperación De La Información

Las principales herramientas que se utilizan para la recuperación de la información:

Algunas Técnicas De Recuperación De La Información.

Calidad De La Recuperación.

martes, 22 de marzo de 2016

Sistema De Búsqueda De Google

CONCLUSIÓN:

martes, 8 de marzo de 2016

SISTEMAS DE ALMACENAMIENTO ACTUALES Y TENDENCIAS DEL FUTURO

SISTEMAS DE ALMACENAMIENTO ACTUALES Y TENDENCIAS DEL FUTURO

SISTEMAS DE ALMACENAMIENTO ACTUALES

FUTURO DE LOS SISTEMAS DE ALMACENAMIENTO

miércoles, 24 de febrero de 2016

Los lenguajes de programación actuales.

Los lenguajes de programación actuales.

Origen del lenguaje de programación.

Evolución del lenguaje de programación:

El lenguaje ideal

Lenguajes de programación actuales.

Documentación de apoyo:

sábado, 13 de febrero de 2016

Información y documentación.

Las ciencias de la documentación.

Tipología de documentos.

Cadena documental.

Fuentes de información.