Páginas

martes, 22 de marzo de 2016

Sistema De Búsqueda De Google

 
Muchos nos preguntamos cómo es que Google puede ser tan rápido en sus búsquedas y predecir lo que vas a buscar en cuestión de milisegundos.Para conocer cómo funciona Google debemos de conocer las principales herramientas ha utilizado y posteriormente se han cambiado o actualizado por otras más eficaces.


Crawler Googlebot y Google Spider: Google Spider/Bot es un programa que está en funcionamiento las veinticuatro horas del día buscando nuevas páginas webs para poder actualizar el contenido aunque no los registra oficialmente hasta que tenga peticiones. Sólo los recoge y los envía al Crawler que los guarda en su base de datos y los analiza.
Spider ----> Recoge.
Crawler ---->Analiza y almacena la página.
Esto quiere decir que si una página web no ha sido rastreada y analizada por el Crawler no aparecerá en resultados de búsqueda de Google.

Spider analiza las páginas que tienen en su índice y sigue sus links y de ese enlace a otra página que contiene otros links que llevan a otra página. Una vez que se rastrea una página Google realiza el proceso de  indexación que ordena el índice según la importancia respecto a la palabras clave. Este proceso de indexación es lo que otorga calidad a las búsquedas de google, pues eliminando las "stopwords", que son aquellas palabras generales que no aportan a la búsqueda ("el, la, lo, las, en ...")

La rapidez de Google viene dada porque utiliza sus propios índices en vez de utilizar el internet.


El servidor donde se procesa la búsqueda del usuario es Google Query Processor. Lo primero que hace es pedir el índice de la multitud de páginas que ha rastreado que contienen las palabras clave de la búsqueda del usuario , una vez que tiene todas las páginas con las palabras clave Google utiliza dos herramientas para que la búsqueda sea  rápida, pero no lo suficientemente eficaz; es decir,puede que no tenga calidad, que no sea justo lo que busca el usuario. Dichas herramientas son Algoritmo y Page Rank. 
  • El Algoritmo de Google según las palabras clave de la búsqueda que haya solicitado el usuario, analiza si se encuentran en el título, en la propia URL de la página, si se repite muchas veces en dicha página... Pero esto no garantiza la buena calidad de la página, es por eso que después del algoritmo pasa al Page Rank.

  • Page Rank: es utilizado para la relevancia óptima del usuario, en una escala del uno al diez la puntúa, estas condiciones están dadas por el número de veces que el link de una página se comparte en otras páginas, y si es citado en webs importantes que tienen muchos usuarios aparecerá de las primeras.
 
Actualmente el funcionamiento interno de Google está establezido por Google Caffeine. Es un motor de búsqueda que hace índices más rápido, con más contenido, más eficaz, más sólido que el Spider. Junto al Google Caffeine se suma Google Mayday.

Google Mayday es un cambio del algoritmo utilizado anteriormente por Google que promociona los sitios más pequeños que merecen la pena, que son más eficaces y mejora la calidad. Esto ha perjudicado a las grandes páginas que no pueden actualizar todo el contenido que tienen, pero es algo necesario, pues el usuario que utiliza Google quiere encontrar lo más actual y de buena calidad que existe en la red.

Con esta nueva mejora el Page Rank ya no tiene tanto sentido, pues el mejor contenido no es necesariamente el enlace que más se ha compartido. Pero aun así Page Rank seguirá computando con menos frecuencia

CONCLUSIÓN:

¿Por qué Google es tan rápido?
Google no busca en Internet, busca en su índice que está constantemente actualizándose por el spider.
 
¿Cómo garantizar que las primeras entradas que presenta Google son de calidad?
Hace 10 años Google utilizaba su Algoritmo, el cual simplemente buscaba páginas que tuviesen las mismas palabras que escribía el usuario, y el Page Rank el cual cuanto más se compartía la URL de dicha página salía de las primeras.
Esto no garantizaba la calidad de que el resultado fuese lo que buscaba el usuario, fue por eso que se implantó el Google Mayday y el Google Caffeine ayudando a las páginas que realmente aportan información de buena calidad, sea conocida o no.
 
Enlaces solicitados:
https://support.google.com/adwords/answer/2454010?hl=es
https://support.google.com/adwords/answer/140351?hl=es
http://www.top-rankin.com/como-funciona-google/
http://www.top-rankin.com/que-es-google-caffeine/

martes, 8 de marzo de 2016

SISTEMAS DE ALMACENAMIENTO ACTUALES Y TENDENCIAS DEL FUTURO

SISTEMAS DE ALMACENAMIENTO ACTUALES Y TENDENCIAS DEL FUTURO

La evolución de los sistemas de almacenamiento han evolucionado de una forma increíble, pues hemos pasado de utilizar disquetes a utilizar "la nube" de internet, la cual es mucho más eficaz que el disquete.
En este blog nos centraremos más en los sistemas de almacenamiento actuales, tanto físicos como virtuales. Personalmente aunque los virtuales se utilizan muchísimo, si son datos privados que no quieres que sean visto por cualquier otra persona te recomiendo usar los sistemas de almacenamiento físicos, pues a mi entender son más seguros, aunque te recomiendo guardar antes el archivo en varios sistemas físicos porque tienen más posibilidades de romperse o dejar de funcionar.

 SISTEMAS DE ALMACENAMIENTO ACTUALES 

MEMORIA RAM es la más utilizada actualmente, pues todos los dispositivos que utilizamos poseen dicha memoria. Dicha memoria permite ejecutar todo tipo de aplicaciones. Una de las memorias de almacenamiento aleatorio que se utilizó durante los 90 fue en Windows95 utilizando 16 MB, y en la actualidad es normal encontrar ordenadores entre 4 y 8 Gigabytes y en los móviles entre 1 y 2 Gigabytes.

CD's y DVD's son sistemas de almacenamiento que se siguen utilizando aunque existan sistemas mucho más avanzados. En la actualidad los podemos encontrar muy comunes en videojuegos, música, películas, aplicaciones o programas... (Aunque existan las ventas virtuales que se guardan automáticamente).

Existen varios tipos de CD's:
  • CD-ROM / DVD-ROM: lectora de CD/DVD.
  • CD-R / DVD-R:  Grabadora de CD/DVD.
  • CD-RW / DVD-RW: Permite regrabar discos.
Actualmente los discos que más calidad aportan son Blue-ray Disc, pues en estos discos se pueden ver las imágentes en alta definición, teniendo más calidad de imagen que el DVD.
 
BASES DE DATOS es un conjunto almacenado de información en un soporte que la permite ser legible por el ordenador. Una de las principales razones por las que actualmente está siendo muy utilizada es porque es posible recopilar todo tipo de información.
Big Data es el proceso de recopilar grandes cantidades de datos y hacer un análisis instantáneo para encontrar información oculta...
Para explicar la definición de Big Data muchos recurren a la utilización de las cinco V's:
  • Volumen: capta y ordena toda la información.
  • Velocidad: otorga agilidad a la hora de ordenar datos.
  • Variedad: mezcla tipos de información.
  • Veracidad: herramientas que buscan y encuentran información sobre un dato.
  • Valor: aportan un valor a la sociedad. pues es innovador y crea competencia.
  • BASES DE DATOS ESTRUCTURADAS:
Formadas por registros que están estructurados en campos y gestionadas por una base de datos racional, capaz de realizar operaciones para datos dobre contabilidad, principalmente en empresas que no son muy grandes.
El Big Data en bases de datos estructurados actúan almacenando en tablas datos que poseen un formato y una longitud específicas, por ejemplo el número de personas que viven en Archidona.
  • BASES DE DATOS NO ESTRUCTURADAS:
Son datos que pueden estar semiestructurados o no estructurados. Los datos semi-estructurados poseen una organización interna que hace más sencillo de tratar y más rápido. Esto es una gran ventaja para los centros comerciales, pues usar una base de datos tradicional en empresas grandes sería muy complicado y llevaría mucho tiempo.
El Big Data en bases de datos no estructurados no puede almacenar en tablas  datos que no tienen formato ni longitud. Como son los de tipo texto (Por ejemplo este blog, redes sociales) o los que no son de tipo texto (Vídeos, Imágenes...).

Frente a todas las ventajas que presenta Big Data existe un principal inconveniente que es la privacidad, pues no la única posibilidad de que no encuentren datos tuyos es porque existen tantos de los demás usuarios que los tuyos pueden pasar desapercibidos.

Un concepto a destacar de las bases de datos son los Metadatos. Es un dato sobre el dato, se utiliza para evitar un mal uso por los usuarios que no están familiarizados al mundo bibliotecario. Son un grupo de atributos que sirven para hallar la fuente de la que proviene.

Para consultar en las Bases de Datos se utilizá el lenguaje de consulta estructurado Structured Query Language (SQL). Se usa para consultar, eliminar o modificar datos en una Base de Datos, además de aclarar conceptos.

Las consultas son conocidas principalmente por recuperar los datos deseados de las tablas, pues gracias a ellas podemos filtrar los datos para obtener sólo unos registros específicos. Existen dos tipos de consultas:
  • Selección: hace que se muestren disponibles para el uso y recupera datos.
  • Acción: realizan una tarea con datos. Por ejemplo; crear nuevas tablas, eliminar o actualizar datos ...etc
 
Otro sistema de almacenamiento es la MEMORIA USB (PENDRIVE), creada por IBM en 1998. Actualmente es de los sistemas de almacenamientos más fáciles de encontrar en el bolsillo de cualquier persona, pues aún la nube de internet falla, y sin embargo un pendrive no necesita nada más que la conexión al ordenador. También existe el disco duro, donde caben muchísimos más datos, pero no es tán ligero como el pendrive.
El sistema de almacenamiento más innovador es LA NUBE. Donde podemos guardar todo tipo de ficheros siempre que tengamos conexión a internet. Además de guardarse de una forma muy rápida es la más cómoda de todas, yo personalmente recomiendo Dropbox, aunque siempre que subas ficheros a la nube debes de saber que un usuario con conocimientos avanzados puede copiar o robarte los ficheros subidos, pero normalmente no se suele dar este mal uso.

FUTURO DE LOS SISTEMAS DE ALMACENAMIENTO

Una investigación reciente de la empresa IBM ha estudiado que cada dieciocho meses los usuarios demandan el doble de capacidad, y que cada año los datos estructurados crecen un 32% y los no estructurados un 63%.

Marius Costache ,investigador rumano, descubrió con la física cuántica que modificando la orientación del electrón, el espín, entendido como una esfera. Al ser el electrón como una esfera éste podría orientarse en cualquier dirección y no sólo en las dos que conocemos atualmente. Es así como se podría almacenar muchísimos más datos o incluso almacenar infinitos datos. 

SSD proviene de los términos Solid-State drive, este disco duro almacena datos y ayuda a tener un rendimiento de almacenamiento mejor que hace que el ordenador esté optimizado y funcione más rápido, proporciona mayor longevidad y menos tiempo de espera al realizar cualquier tipo de tarea con el ordenador. Es una mejora del disco HDD, y la diferencia se encuentra en su método de almacenamiento.
Dicho método explicado de una forma sencilla consiste en el almacenamiento de la información en bloques creados y cuando el ordenador quiere usarlo el SDD se lo entrega. 
SSD tiene una desventaja, pues no en todos permite actualizar el sistema operativo del ordenador al que va integrado, es uno de los datos que tendrás que tener en cuenta cuando quieras comprar uno de estos.

También se está estudiando crear discos duros con ADN, con el que no se necesita electricidad para su funcionamiento. Aunque ya se ha demostrado que es un sistema rápido y eficaz el elevado coste que posee no saldría rentable; ya que los usuarios no lo comprarían. Otra desventaja es que el ADN no se puede reescribir, implicando a crear secuencias nuevas cada vez que se quieran añadir datos.

¿Qué nos espera el futuro?¿Veremos los avances actuales de almacenamiento ridículos ante los del futuro? Sólo queda esperar.
Enlaces:
https://es.wikipedia.org/wiki/Evoluci%C3%B3n_de_los_dispositivos_de_almacenamiento
http://www.mariapinto.es/e-coms/bases-de-datos/
http://www.ids-ac.com/index.php?option=com_content&view=article&id=20&Itemid=52
http://html.rincondelvago.com/base-de-datos_6.html 
http://catedradatos.com.ar/2013/10/teorico-12-redes-el-lado-oscuro-de-los-datos/
http://mibloguel.com/big-data-significado-y-su-utilidad-en-la-sociedad/
http://www.sedic.es/autoformacion/metadatos/tema1.htm
http://www.toshibacenter.es/que-son-los-metadatos-para-que-sirven-los-metadatos/ 
http://es.slideshare.net/csalazarc/consultas-base-de-datos-en-sql 
https://support.office.com/es-es/article/Conceptos-b%C3%A1sicos-sobre-bases-de-datos-a849ac16-07c7-4a31-9948-3c8c94a7c204
http://www.dell.com/learn/co/es/cobsdt1/sb360/sb-newsletter-3-2012-2 
ftp://public.dhe.ibm.com/software/es/events/doc/start013/13/7-Tendencias-y-futuro-almacenamiento.pdf
http://www.elmundo.es/economia/2015/07/23/55b1280d22601d05068b459e.html 
http://blogthinkbig.com/hdd-versus-ssd/
http://www.seagate.com/es/es/tech-insights/future-of-solid-state-storage-in-laptops-master-ti/
http://www.bbc.com/mundo/noticias/2013/01/130124_ventajas_archivar_documentos_adn
http://www.batanga.com/curiosidades/4187/cientificos-logran-utilizar-adn-para-almacenar-datos