Cómo crear y optimizar un feed de RSS para tu sitio web
Los desarrolladores web a menudo son solicitados para crear sitios que cubran todas las necesidades e intereses de la audiencia. Es por eso que la funcionalidad de agregación de contenido, como RSS, se ha vuelto tan popular en la comunidad de desarrollo web, y por qué debería ser parte de tu conjunto de herramientas.
¿Qué es RSS?
RSS es un formato XML utilizado para suministrar contenido web selectivo y resumido a los clientes de agregadores de contenido. Más precisamente, RSS es un "formato de descripción y sindicación de metadatos, ligero, multipropósito y extensible", que cumple con la especificación RDF de W3C.
Existen muchas versiones de RSS, como 0.91 de Netscape y la última, 2.0, de UserLand, cada una con algunas características únicas adecuadas para cierto tipo de contenido. Puedes elegir implementar cualquiera de estas versiones según los requisitos. Son igualmente populares y la mayoría de las herramientas y agregadores de RSS funcionan con todas ellas. Para estar seguro, puedes usar un subconjunto de elementos RSS comunes a todas las versiones para mantener la compatibilidad con las demás. Este artículo se basa en la ampliamente utilizada versión 1.0 de RSS, pero la información ofrecida aquí se aplicará a las otras versiones, ya que los conceptos básicos de todas las versiones son los mismos.
Un vistazo a RSS
La especificación de RSS describe un conjunto simple de elementos XML que se pueden utilizar para crear un resumen del contenido de un sitio web. Este resumen puede consistir en el logotipo del sitio web, un enlace al sitio, un cuadro de entrada y múltiples "noticias". Este resumen o una colección de resúmenes de un sitio web se conoce como un RSS feed. Los feeds de RSS son publicados y sindicados por los sitios de proveedores de contenido y consumidos por sitios web agregadores de contenido, también conocidos como portales, o por herramientas independientes de escritorio.
Los feeds de RSS pueden generarse manualmente creando y publicando un archivo RSS (por ejemplo, latest_news.rss) en un sitio web. Varias herramientas y servicios en línea generan automáticamente feeds de RSS a partir del contenido existente de un sitio web, lo que a menudo resulta útil cuando se recopilan datos de sitios que ofrecen contenido dinámico. Para sitios web desarrollados con Perl, el módulo XML::RSS puede automatizar la creación de un feed de RSS. Para sitios web basados en ASP, hay una colección de herramientas disponibles en TNL Net. Xpath2rss es una herramienta para recopilar información de sitios web usando expresiones XPath. También están disponibles servicios en línea de recopilación de información como myRSS y Resúmenes de sitios en XHTML.
Generando un feed de RSS
Puedes crear un archivo RSS que contenga un feed de RSS utilizando cualquier editor de texto o XML. Un archivo RSS contiene tanto elementos raíz como elementos RSS, que se describen a continuación.
Cómo configurar Postfix para bloquear el spam y proteger tu servidor de correo electrónicoElementos raíz
Un feed de RSS, al ser un documento XML válido, puede comenzar con una declaración XML, <?xml version="1.0"?>
. Incluir esta declaración es opcional, aunque se recomienda para mantener la compatibilidad con versiones anteriores de XML.
Para cumplir las especificaciones RDF, los elementos RSS restantes que forman el feed de RSS deben estar encerrados dentro del elemento raíz utilizando las etiquetas <rdf:RDF> y </rdf:RDF>. Este elemento raíz asocia el prefijo de espacio de nombres rdf con el esquema de sintaxis RDF y lo convierte en el espacio de nombres predeterminado para el documento. El código a continuación muestra la estructura básica de un archivo RSS:
<?xml version="1.0"?>
<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns="http://purl.org/rss/1.0/">
...
</rdf:RDF>
Elementos RSS
Un feed de RSS generalmente consta de cuatro elementos principales: <channel>, <image>, <item> y <textinput>. El elemento <channel> es obligatorio, al igual que al menos una ocurrencia del elemento <item>. Los elementos <textinput> y <image> son opcionales y se usan según sea necesario.
<channel>: El elemento <channel> contiene una breve descripción del canal (la fuente del feed de RSS). Tiene un atributo rdf:about="URL_del_recurso", donde URL_del_recurso es una URL única que apunta a la página de inicio del proveedor del feed o a la URL del propio feed de RSS. El elemento <channel> contiene los siguientes elementos secundarios, que son requeridos a menos que se especifique lo contrario:
- <title>: es el nombre/título del canal.
- <link>: es la URL de la página web que contiene el contenido completo relacionado con el contenido del canal.
- <description>: es una breve información sobre el contenido del <channel>.
- <image>: es una etiqueta opcional y vacía. Se requiere solo cuando existe una etiqueta <image> externa. Tiene un atributo rdf:resource="URL_de_la_imagen", donde URL_de_la_imagen es la URL de la imagen asociada con el canal (generalmente el logotipo del canal).
- <textinput>: es una etiqueta opcional y vacía. Se requiere solo cuando existe una etiqueta <textinput> externa. Tiene un atributo rdf:resource="URL_de_entrada_de_texto", donde URL_de_entrada_de_texto es la URL de destino de un formulario de entrada de usuario.
- <items>: es una lista de elementos de contenido incluidos en un feed. Tiene la siguiente sintaxis:
<items><rdf:Seq>
<rdf:li resource="URL_del_item_1" />......<rdf:li resource="URL_del_item_n" />
</rdf:Seq></items>
Aquí, URL_del_item_n es la URL fuente de contenido para un elemento. Cada entrada <rdf:li /> corresponde a un elemento <item>.
El elemento <channel> junto con sus elementos hijos <title> y <link> se pueden representar juntos como un titular con hipervínculo, seguido de un elemento <description>. El elemento <channel> sirve como una tabla de contenido para el feed de RSS, con hijos como <image>, <items> y <textinput> que apuntan a la ubicación de los elementos RSS correspondientes <image>, <item> y <textinput>. Puedes encontrar más información al respecto en las especificaciones de RSS. El código a continuación muestra un ejemplo de un elemento <channel> completo:
Cómo bloquear los correos electrónicos falsificados en Postfix
<channel rdf:about="http://www.xml.com/xml/news.rss">
<title>XML.com</title>
<link>http://xml.com/pub</link>
<description>
XML.com ofrece una rica variedad de información y servicios
para la comunidad XML.
</description>
<image rdf:resource="http://xml.com/universal/images/xml_tiny.gif" />
<items>
<rdf:Seq>
<rdf:li resource="http://xml.com/pub/2000/08/09/xslt/xslt.html" />
<rdf:li resource="http://xml.com/pub/2000/08/09/rdfdb/index.html" />
</rdf:Seq>
</items>
<textinput rdf:resource="http://search.xml.com" />
</channel>
<image>: El elemento <image> especifica la imagen asociada con un canal, preferiblemente de tamaño 88x31 píxeles. Tiene un atributo rdf:about, cuyo valor es el mismo que el valor del atributo rdf:resource de <image> dentro de <channel>. El elemento <image> tiene los siguientes elementos secundarios, requeridos a menos que se especifique lo contrario:
- <title>: es el texto alternativo de la imagen (atributo alt de la etiqueta HTML <img>).
- <link>: es la URL de la fuente de la imagen, generalmente la página de inicio de un proveedor de canal.
- <url>: es la URL de una imagen en el sitio web del proveedor del canal.
<item>: El elemento <item> especifica un artículo, como un titular de una noticia, hiperenlazado al contenido completo en el sitio web del proveedor del canal y seguido de una breve descripción. Este elemento forma una parte dinámica del feed de RSS. Se permite entre uno y 15 elementos por feed. Un <item> tiene un atributo rdf:about, cuyo valor es el mismo que el valor de rdf:resource de la entrada correspondiente de la lista <items> dentro de <channel>. El elemento <item> tiene los siguientes elementos secundarios, requeridos a menos que se especifique lo contrario:
- <title>: es el nombre/título de un elemento.
- <link>: es la URL del contenido completo relacionado con un elemento. Su valor debe ser idéntico al valor del atributo rdf:about.
- <description>: es una descripción breve y opcional de un elemento que aparece después del título hiperenlazado. Como máximo, puede haber una instancia por cada elemento.
<textinput>: El elemento <textinput> se utiliza para mostrar un campo de formulario HTML para enviar datos de entrada del usuario. Tiene un atributo rdf:about, cuyo valor es el mismo que el valor del atributo rdf:resource de <textinput> dentro de <channel>. El elemento <textinput> tiene los siguientes elementos secundarios, requeridos a menos que se especifique lo contrario:
- <title>: es el título del campo de entrada, por ejemplo, Enviar o Buscar.
- <description>: es una breve descripción del propósito del campo de entrada, por ejemplo, Enviar tus comentarios.
- <name>: es el nombre del campo de entrada.
- <link>: es la URL de destino a la que se dirige el envío del campo de entrada. Su valor es el mismo que el valor de rdf:about.
Un tutorial útil que cubre los principales aspectos de RSS está disponible en el Tutorial RSS para editores de contenido y webmasters.
Utilizando estos elementos, se puede crear un feed de RSS y guardarlo en un archivo .rss. Listado A ilustra un archivo RSS completo, xmlcomfeed.rss. (Este es un extracto de RDF Site Summary 1.0).
Validando un archivo RSS
Después de generar un archivo RSS, este debe ser validado para verificar la existencia de errores. Hay muchos validadores de RSS disponibles en línea para realizar esta tarea, como el Validador de RSS 0.9x en línea y el Validador de RSS 1.0 en línea.
Las nuevas características de Word 2002 que te ahorrarán tiempo y esfuerzoPublicando un feed de RSS
Después de generar y validar, los archivos RSS se publican en línea al publicarlos en el sitio web. Ahora, tienes que anunciar la disponibilidad de un feed de RSS en el sitio web y sindicarlo para llevarlo a una audiencia más amplia.
Para informar a las personas sobre la disponibilidad de un feed de RSS, puedes incluir enlaces como el siguiente en las páginas web: "El feed RSS para esta página está disponible aquí"
Una alternativa es colocar una etiqueta <link> dentro de una etiqueta <head> de una página HTML, de la siguiente manera:
<html>
<head><title>Noticias</title>
<link rel="alternate" type="application/rss+xml"
href="URL_del_feed.rss " title="RSS del feed de noticias">
</head>
....
</html>
Aunque es una buena idea proporcionar un feed de RSS "central" vinculado a la página de inicio de un sitio web, es posible proporcionar feeds de RSS separados para diversas secciones del sitio con contenido dinámico. Una forma sencilla de sindicar un feed de RSS es permitir que cualquier persona interesada se suscriba y agregue tu contenido. Otras formas incluyen la sindicación mediante el registro de un feed de RSS en directorios como Yahoo o enviando la URL de tu feed de RSS a portales de agregadores de contenido.
Consumiendo un feed de RSS
Consumir un feed de RSS significa analizar el feed y convertir su contenido en un formato visualizable. Los feeds de RSS pueden ser consumidos tanto por portales de agregadores de contenido, como My Yahoo, My UserLand, Meerkat y Moreover, como por herramientas como Headline Viewer, NetNewsWire y Radio UserLand para uso personal y comercial. También están disponibles complementos para algunos clientes de correo electrónico, como MS Outlook, que realizan la agregación de contenido en el escritorio para uso personal.
Además, se pueden escribir scripts simples en cualquier lenguaje que admita RSS, incluidos Java, PHP, Perl, ASP y C#, para analizar un feed de RSS. Listado B presenta un ejemplo de dicho programa escrito en Java. Este programa también brinda una idea general de cómo se deben analizar los feeds de RSS utilizando otros lenguajes de scripting.
Cómo acceder y utilizar el calendario en Lotus NotesRSS en acción
RSS es fácil de entender e implementar. Con la modularización y la conformidad con RDF, RSS está evolucionando aún más para satisfacer las crecientes necesidades de aplicaciones, como la agregación, los hilos de discusión, las listas de empleo, las listas de los 10 más populares, los servicios de listados múltiples, las puntuaciones deportivas y la catalogación de documentos.
En Newsmatic nos especializamos en tecnología de vanguardia, contamos con los artículos mas novedosos sobre Software, allí encontraras muchos artículos similares a Cómo crear y optimizar un feed de RSS para tu sitio web , tenemos lo ultimo en tecnología 2023.
Artículos Relacionados