Cuadro de información

Plantilla utilizada para recopilar y presentar un subconjunto de información sobre un tema

Un infobox es una tabla física o digital que se utiliza para recopilar y presentar un subconjunto de información sobre su tema, como un documento . Es un documento estructurado que contiene un conjunto de pares atributo-valor , ^[1] y en Wikipedia representa un resumen de información sobre el tema de un artículo . ^[2] De esta manera, son comparables a las tablas de datos en algunos aspectos. Cuando se presenta dentro del documento más grande que resume, un infobox a menudo se presenta en un formato de barra lateral .

Un infobox se puede implementar en otro documento transcluyéndolo en ese documento y especificando algunos o todos los pares atributo-valor asociados con ese infobox, lo que se conoce como parametrización .

Wikipedia

Un infobox puede utilizarse para resumir la información de un artículo en Wikipedia . ^[3] Se utilizan en artículos similares para garantizar la coherencia de la presentación mediante el uso de un formato común. ^[4]^[2] Originalmente, los infoboxes (y las plantillas en general) se utilizaban para fines de diseño de páginas . ^[2] Un infobox puede incorporarse a un artículo especificando el valor de algunos o todos sus parámetros . ^[5] El nombre del parámetro utilizado debe ser el mismo que el especificado en la plantilla del infobox, pero se le puede asociar cualquier valor. ^[5] El nombre está delimitado del valor por un signo igual . ^[5] El nombre del parámetro puede considerarse un atributo del tema del artículo. ^[6]

{{ Infobox comida preparada | nombre =  | imagen =  | tamaño de la imagen =  | título =  | nombre alternativo =  | país =  | región =  | creador =  | curso =  | tipo =  | servido =  | ingrediente principal =  | variaciones =  | calorías =  | otro =  }}

{{ Infobox comida preparada | nombre = Crostata | imagen = Crostata limone e zenzero 3.jpg | tamaño de la imagen =  | título = Crostata con relleno de limón y jengibre | nombre_alternativo =  | país =  [[ Italia ]] | región =  [[ Lombardía ]] | creador =  | curso =  [[ Postre ]] | tipo =  [[ Tarta ]] | servido =  | ingrediente_principal = Masa de hojaldre, [[ mermelada ]] o [[ ricotta ]] , fruta | variaciones =  ''Crostata di frutta'' , ''crostata di ricotta'' , muchas otras variaciones dulces o saladas | calorías =  | otros =  }}

El infobox Infobox alimentos preparados utilizado en artículos de Wikipedia relacionados con alimentos, sin valores especificados para sus parámetros (atributos).

El mismo cuadro de información que se implementó en el artículo crostata . Los valores están a la derecha del signo igual (=), y los nombres de los parámetros son los mismos que los de la especificación de la plantilla del cuadro de información. Los valores están en formato wiki : las entradas entre corchetes (por ejemplo, [[Tart]]) se mostrarán como un enlace al artículo de Wikipedia correspondiente (por ejemplo, Tart ), y el archivo vinculado se incluirá en el artículo en lugar de su formato.

En Wikipedia, un cuadro de información se transcluye en un artículo encerrando su nombre y pares de atributo-valor dentro de un doble conjunto de llaves . El software MediaWiki en el que opera Wikipedia analiza el documento, para lo cual el cuadro de información y otras plantillas son procesadas por un procesador de plantillas . Este es un motor de plantillas que produce un documento web y una hoja de estilo utilizada para la presentación del documento. Esto permite que el diseño del cuadro de información se separe del contenido que manipula; ^[2] es decir, el diseño de la plantilla se puede actualizar sin afectar la información dentro de ella, y el nuevo diseño se propagará automáticamente a todos los artículos que transcluyan el cuadro de información. ^[4] Por lo general, los cuadros de información están formateados para aparecer en la esquina superior derecha de un artículo de Wikipedia en la vista de escritorio, ^[3] o en la parte superior en la vista móvil.

La ubicación de un cuadro de información dentro del wikitexto de un artículo es importante para la accesibilidad . ^[7] Una buena práctica es colocarlos después de las plantillas de desambiguación (aquellas que dirigen a los lectores a artículos sobre temas con nombres similares) y plantillas de mantenimiento (como la que marca un artículo como no referenciado), pero antes de todo el resto del contenido . ^[8]^[9]

Baeza-Yates y King dicen que algunos editores encuentran complicadas las plantillas como los infoboxes, ^[10] ya que la plantilla puede ocultar texto sobre una propiedad o recurso que el editor desea cambiar; esto se ve agravado por las plantillas encadenadas, es decir, plantillas transcluidas dentro de otras plantillas. ^[10]

En agosto de 2009, la Wikipedia en inglés utilizaba alrededor de 3000 plantillas de infobox que, en conjunto, utilizaban más de 20 000 atributos. ^[11] Desde entonces, muchas se han fusionado para reducir la redundancia. En junio de 2013, había al menos 1 345 446 transclusiones de la plantilla Infobox original , ^[12] utilizada por algunos, pero no todos, los infoboxes, en 4 251 127 artículos.

El nombre de un Infobox normalmente es "Infobox [género]"; sin embargo, a los infoboxes de uso generalizado se les pueden asignar nombres más cortos, como "taxobox" para taxonomía. ^[8]

Aprendizaje automático

En 2008, aproximadamente el 44,2% de los artículos de Wikipedia contenían un cuadro de información ^[13] y en 2010, aproximadamente el 33% . ^[14] La extracción automática de conocimiento semántico mediante algoritmos de aprendizaje automático se utiliza para "extraer información procesable por máquina a un coste de complejidad relativamente bajo". ^[1] Sin embargo, la baja cobertura lo hace más difícil, aunque esto se puede superar parcialmente complementando los datos del artículo con los de las categorías en las que se incluye el artículo. ^[13] La Wikipedia en francés inició el proyecto Infobox Versión 2 en mayo de 2011. ^[15]^[16]

El conocimiento obtenido mediante el aprendizaje automático se puede utilizar para mejorar un artículo, por ejemplo, mediante el uso de sugerencias de software automatizadas para que los editores agreguen datos del cuadro de información. ^[13] El proyecto iPopulator creó un sistema para agregar un valor al parámetro del cuadro de información de un artículo mediante un análisis automático del texto de ese artículo. ^[11]

DBpedia utiliza contenido estructurado extraído de infoboxes ^[2] mediante algoritmos de aprendizaje automático para crear un recurso de datos vinculados en la Web Semántica ; Tim Berners-Lee lo ha descrito como "uno de los componentes más famosos" del proyecto de datos vinculados. ^[17]

La extracción por máquina crea un triple que consiste en un sujeto, un predicado o relación y un objeto. ^[1] Cada par atributo-valor del infobox se utiliza para crear una declaración RDF utilizando una ontología . ^[18] Esto se ve facilitado por la brecha más estrecha entre Wikipedia y una ontología que la que existe entre un texto libre o no estructurado y una ontología. ^[19]

La relación semántica entre el sujeto y el objeto se establece mediante el predicado. ^[1] En el cuadro de información de ejemplo, el triple ("crostata", tipo, "tarta") indica que una crostata es un tipo de tarta . El tema del artículo se utiliza como sujeto, el nombre del parámetro se utiliza como predicado y el valor del parámetro como objeto. ^[18]^[1] Cada tipo de cuadro de información se asigna a una clase de ontología, y cada propiedad (parámetro) dentro de un cuadro de información se asigna a una propiedad de ontología. ^[20] Estas asignaciones se utilizan al analizar un artículo de Wikipedia para extraer datos.

Metadatos

Al presentar los hechos básicos de un artículo dentro de un cuadro de información, también se permite presentar los hechos de una manera amigable para la máquina, lo que permite una funcionalidad adicional, como cuando se pega un enlace a una wikipedia en un programa compatible, en lugar de publicar solo el enlace, también se publica otra información como la imagen del artículo.

Citas

^ abcde Baeza-Yates y King 2009, p. 31.
^ abcde Liyang 2011, pág. 385.
^ desde Broughton 2008, pág. 357.
^ desde Broughton 2008, pág. 17.
^ abc Broughton 2008, pág. 18.
^ Baeza-Yates y King 2009, pág. 30.
^ Broughton 2008, pág. 234.
^ desde Broughton 2008, pág. 235.
^ La política de la Wikipedia en inglés sobre accesibilidad se especifica en Wikipedia:Manual de estilo/Accesibilidad . La política sobre el diseño del wikitexto se especifica en Wikipedia:Manual de estilo/Diseño y Wikipedia:Manual de estilo/Sección principal .
^Ab Baeza-Yates & King 2009, pág. 345.
^ ab Lange, Böhm y Naumann 2010, pág. 7.
^ "Herramientas del servidor de herramientas de Jarry1250: recuento de transclusiones de plantillas". Lista de proyectos de Wikimedia . 7 de junio de 2013 . Consultado el 7 de junio de 2013 .
^ abc Baeza-Yates & King 2009, pág. 28.
^ Lange, Böhm y Naumann 2010, pág. 5.
^ Geertman, Reinhardt y Toppen 2011, pág. 493.
^ El proyecto está alojado en la página de Wikipedia en francés Infobox/V2.
^ Miller 2008.
^Ab Liyang 2011, pág. 387.
^ Virvou y Matsuura 2012, pág. 315.
^ Liyang 2011, pág. 395.

Obras citadas

Baeza-Yates, Ricardo; King, Irwin, eds. (2009). Servicios de tejido y personas en la World Wide Web . Springer. ISBN 9783642005695. Número de serie LCCN 2009926100.
Broughton, John (14 de julio de 2008). Barbero, Nan; Meyers, Peter (eds.). Wikipedia – El manual perdido . Medios O'Reilly . ISBN 9780596553777.
Geertman, Stan; Reinhardt, Wolfgang; Toppen, Fred, eds. (2011). "Avanzando en la ciencia de la geoinformación para un mundo cambiante" . Apuntes de conferencias sobre geoinformación y cartografía. vol. 1. Saltador. doi :10.1007/978-3-642-19789-5. ISBN 9783642197888. ISSN 1863-2246. LCCN 2011925152.
Lange, Dustin; Böhm, Christoph; Naumann, Félix (2010). Extracción de información estructurada de artículos de Wikipedia para completar cuadros de información. Universitätsverlag Potsdam. ISBN 9783869560816Archivado desde el original el 6 de junio de 2014. Consultado el 2 de junio de 2013 . {{cite book}}: |work=ignorado ( ayuda )
Yu, Liyang (2011). Guía para desarrolladores de la Web semántica . Springer. Bibcode :2011adgt.book.....Y. doi :10.1007/978-3-642-15970-1. ISBN 9783642159695.
Miller, Paul (7 de febrero de 2008). "Sir Tim Berners-Lee habla con Talis sobre la Web semántica". Transcripción de CastingWords. Talis Group. Archivado desde el original el 10 de mayo de 2013. Consultado el 2 de junio de 2013 .
Virvou, Maria; Matsuura, Saeko, eds. (2012). Ingeniería de software basada en el conocimiento: Actas de la décima conferencia conjunta sobre ingeniería de software basada en el conocimiento . Frontiers and Artificial Intelligence and Applications. Vol. 240. IOS Press. ISBN 9781614990932. Número de serie LCCN 2012943674.

Lectura adicional

Kiran, Kumar N.; Santosh, GSK; Varma, Vasudeva (junio de 2011). Recuperación de información multidisciplinaria . Apuntes de clase en informática. Vol. 6653. Springer Berlin Heidelberg. doi :10.1007/978-3-642-21353-3. ISBN 9783642213533. ISSN 0302-9743. S2CID 9901886.
Chutiporn, Anutariya; Domingue, John, eds. (2008). La Web semántica: 3.ª Conferencia asiática sobre la Web semántica, ASWC 2008, Bangkok, Tailandia, 8-11 de diciembre de 2008. Actas . Lecture Notes in Computer Science. Vol. 5367. Springer. ISBN 9783540897033. ISSN 0302-9743.
Wu, Fei; Hoffmann, Ralph; Weld, Daniel s. (2008). "Extracción de información de Wikipedia". Actas de la 14.ª conferencia internacional ACM SIGKDD sobre descubrimiento de conocimiento y minería de datos . Association for Computing Machinery . págs. 731–739. doi :10.1145/1401890.1401978. ISBN . 9781605581934.S2CID 7781746 .

[FOOTNOTEBaeza-YatesKing200931-1] Baeza-Yates y King 2009, p. 31.

[FOOTNOTELiyang2011385-2] Liyang 2011, pág. 385.

[FOOTNOTEBroughton2008357-3] sde Broughton 2008, pág. 357.

[FOOTNOTEBroughton200817-4] sde Broughton 2008, pág. 17.

[FOOTNOTEBroughton200818-5] Broughton 2008, pág. 18.

[FOOTNOTEBaeza-YatesKing200930-6] Baeza-Yates y King 2009, pág. 30.

[FOOTNOTEBroughton2008234-7] Broughton 2008, pág. 234.

[FOOTNOTEBroughton2008235-8] sde Broughton 2008, pág. 235.

[9] La política de la Wikipedia en inglés sobre accesibilidad se especifica en Wikipedia:Manual de estilo/Accesibilidad . La política sobre el diseño del wikitexto se especifica en Wikipedia:Manual de estilo/Diseño y Wikipedia:Manual de estilo/Sección principal .

[FOOTNOTEBaeza-YatesKing2009345-10] Ab Baeza-Yates & King 2009, pág. 345.

[FOOTNOTELangeBöhmNaumann20107-11] Lange, Böhm y Naumann 2010, pág. 7.

[Jarry-12] "Herramientas del servidor de herramientas de Jarry1250: recuento de transclusiones de plantillas". Lista de proyectos de Wikimedia . 7 de junio de 2013 . Consultado el 7 de junio de 2013 .

[FOOTNOTEBaeza-YatesKing200928-13] Baeza-Yates & King 2009, pág. 28.

[FOOTNOTELangeBöhmNaumann20105-14] Lange, Böhm y Naumann 2010, pág. 5.

[FOOTNOTEGeertmanReinhardtToppen2011493-15] Geertman, Reinhardt y Toppen 2011, pág. 493.

[16] El proyecto está alojado en la página de Wikipedia en francés Infobox/V2.

[FOOTNOTEMiller2008-17] Miller 2008.

[FOOTNOTELiyang2011387-18] Ab Liyang 2011, pág. 387.

[FOOTNOTEVirvouMatsuura2012315-19] Virvou y Matsuura 2012, pág. 315.

[FOOTNOTELiyang2011395-20] Liyang 2011, pág. 395.