POOH.CZ Eventi.cz Test rychlosti připojení World of Warcraft LOTRO Pohlednice Menhiry Turistický průvodce Sex průvodce Slovník Android G1 e-knihy a čtečky
Pravidelný občasník originálního humoru

Autor Daniel Dočekal (Kontakt) chlívek (Webdesign, Internet) - vydáno 9.7.2007

Kompletní texty článků v RSS? Samozřejmě že ne

Martin Snížek řeší to co již bylo řešeno nepočítaně. Řeší to pravděpodobně z neznalosti. Odpověď na to, zda RSS feed má obsahovat kompletní texty článků je totiž poměrně jednoduchá. Nemá, zejména proto, že RSS k tomu nikdy nebylo určeno. A toto jednoduché vysvětlení je možné rozvést a více zdůvodnit

  • Data přenášená RSS mají být malá a vše velmi efektivní, není totiž výjimečné, že se stahují každých 10-15 minut. Plné verze článků v takovémto případě nepomohou nikomu. Ti co takováto RSS poskytují budou neustále řešit přetížení systému. Ti co odebírají budou plakat nad přetíženými datovými spoji

  • RSS bylo navrženo s maximální možnou délkou jednotlivých polí, jenom velmi těžko se do této délky vejdou plné texty článků. Jakkoliv tento argument není nejdůležitější, reakce Snížka typu "já to chci, co je mi standardu" je typickou ukázkou omezenosti některých jedinců.

    A dotaženo ad absurdum, proč by RSS feed nemohl obsahovat přímo binarni data. Třeba pár desítek mega MP3 nebo pár set mega nějakého filmu.

  • RSS dokonce vůbec nepředpokládá, že by se v něm plné texty objevovaly. Je snad dost jasné, že pole "description" není určeno k uložení několika stovek až tisícovek znaků. Ne nadarmo RSS znamená RDF Site Summary a ne nadarmo má "description" maximální délku 500 znaků.

  • Existuje bezpočet RSS agregátorů, které nemají kapacity na stahování kompletních textů článků Nestahují totiž kusovky, ale tisíce feedů. A jak už to tak u databázově postavených systémů bývá, pokud nějaké pole ve standardů říká, že smí být maximálně X znaků, tak není databáze navržena na uložení neomezené délky

  • Právě proto, že s RSS se nepočítalo pro přenos kompletních textů, vznikly alternativy. "Schválená" a rozšířená alternativa je Atom, kde je přímo dostupné pole "content".

  • A dodatek, pokud se to posuzuje z hlediska kompletní syndikace obsahu (tedy ne čtení v osobní čtečce). Jak upozorňuje RH, kompletní vlastní obsah na cizích webech je z hlediska SEO nevhodný. Ale to  už je trochu někde jinde, než otázka využití RSS pro osobní čtení. 

Nesmyslnou diskusi na téma zda v RSS mít celý obsah tak lze uzavřít jednoduše. Plný obsah můžete mít v ATOM feedu. V RSS nemá co dělat.

A pokud to stále někomu nedochází, RSS feed s plnými texty článků způsobuje pouze řadu problémů. Prostě proto, že něco takového tam nemá být.

Přidat nový ohlas


RSS alternativní formát

Výpis stromově podle reakcí sestupně/vzestupně nebo Výpis sestupně/vzestupně (*)

Reakce na #74706 (#74707)
Datum : 10.7.2007 18:42:07
Autor : Daniel Dočekal
Předmět : RE:(8) RSS

Další demagogie. V 2.0 specifikaci je položka <author> v jejíž rozšířeném popisu je jasně uvedeno, že například může obsahovat

<author>lawyer@boyer.net (Lawyer Boyer)</author>

Viz například:
http://www.rssboard.org/rss-specification#ltauthorgtSubelementOfLtitemgt

A demagogie je to i s ohledem na toto:

RSS 2.0 adds that capability, following a simple rule. A RSS feed may contain elements and attributes not described on this page, only if those elements and attributes are defined in a namespace.

Jinými slovy, pokud bude existovat odpovídající jmenný prostor definující (například) <authorname>, tak nic nebrání tomu, aby se v RSS 2.0 používal.

S odpuštěním, strč si něco o faktech a opouštění za klobouk, protože opět opomíjíš fakta.

Reagovat



Reakce na #74705 (#74706)
Datum : 10.7.2007 18:13:17
Autor : neregistrovaný návštěvník dgx (77.240.188.**)
Předmět : RE:(7) RSS

Nebyl korektní? Opakuji: "Dlouho neobsahoval kolonku pro čas publikování příspěvku, dosud nemá kolonku pro jméno autora." Dlouho neobsahoval = až do verze 2.0 neobsahoval. Dosud nemá = ani ve verzi 2.0 nemá.

Je mi vážně líto (to není fráze, myslím to tak), že neumíš uznat fakta a raději diskutujícího nařkneš z vyvolávání konfliktů. Nebudu tady už dále překážet, necítím se v této společnosti dobře.

Reagovat



Reakce na #74703 (#74705)
Datum : 10.7.2007 17:54:59
Autor : Daniel Dočekal
Předmět : RE:(6) RSS

Dgx, jsem rád, že potvrzuješ, ze jsi nebyl zcela korektní v původních citacích. Jak je vidět, přeci jeno tam například datum publikace je :)

Komunikace tebou předkládaná není diskuse, je pouze účelovým vyvoláváním konfliktu. A odvádí od zásadních problémů, například toho, který dost jasně uvádí Martin. A na svém blogu dost jasně uvádí enormní navýšení datových přenosů vlivem vkládání kompletních textů.

A už zcela uplně opomíjí pointu. Totiž že pro přenos celých textů je vhodné použít Atom, protože právě tato specifikace již vyřešila všechny zmíněné problémy (třeba i skutečnost, že v původním RSS není možné jasně určit druh přenášených informací).

Reagovat



Datum : 10.7.2007 17:41:01
Autor : neregistrovaný návštěvník Pavel Růžička (62.141.0.**)
Předmět : Proč nedávat celý obsah do RSS

Dovolím si jeden související článek - už staršího data:
http://interval.cz/clanky/hrozba-semantickeho-webu

Reagovat



Reakce na #74702 (#74703)
Datum : 10.7.2007 17:40:40
Autor : neregistrovaný návštěvník dgx (77.240.188.**)
Předmět : RE:(5) RSS

Vyjděme prosím ze stejného informačního zdroje, například http://www.rssboard.org/rss-specification. Limit 500 znaků je zmíněn jen v souvislosti s RSS verze 0.91 z června 2000 a odstraněn ve verzi 0.92 z prosince téhož roku!

Pokud budeme na uvedených limitech bazírovat, tak musím zmínit i limit 15 položek na jeden RSS 0.91 kanál a zeptat se, proč POOH.cz generuje položek 30? Zdržím se primitivních invektiv...

Docela mě udivuje, že dáváte Danieli za pravdu neurvalému Nevermindovi, když má tvrzení lze tak snadno ověřit ve specifikaci.

Kupříkladu že "RSS dlouho neobsahoval kolonku pro čas publikování příspěvku". Konkrétně v RSS < 2.0 neexistují pole pro datum publikování příspěvku, teprve RSS 2.0 zavádí pubDate u elementu item.

Nebo že "RSS dosud nemá kolonku pro jméno autora". U elementu item existuje položka author specifikovaná jakožto "Email address of the author of the item". Nechcete mi snad tvrdit, že email === jméno autora.

Reagovat



Reakce na #74701 (#74702)
Datum : 10.7.2007 16:57:56
Autor : Daniel Dočekal
Předmět : RE:(4) RSS

Čteš špatně Dgx, je pole o kterém je řeč a u toho je uváděno 500 znaků. A to co cituješ (o vyšších verzích RSS) je sice pravda, ale je to jenom začátek oné poznámky.

A jinak bych řekl, že svým způsobem asi Nevermind bude mít pravdu. Protože ony skutečně ty tebou zmíněná pole v některých ze starších specifikací RSS jsou. To abychom to od primitivních invektiv vrátili k věcným záležitostem.

Reagovat



Reakce na #74700 (#74701)
Datum : 10.7.2007 16:39:06
Autor : neregistrovaný návštěvník dgx (77.240.188.**)
Předmět : RE:(3) RSS

Dgx RSS normy zná velmi dobře. Narozdíl od Neverminda, který včera tvrdil, že "Délka polí v RSS má maximální délku". To je samozřejmě hloupost, ve specifikací stojí: "There are no string-length or XML-level limits in RSS 0.92 and greater."

Mimochodem, s lidmi, kteří sami problematice nerozumí, ale přitom okolí častují výkřiky jako "kretén" nebo "přestaňte řešit kraviny" by dgx nikdy do hospody nešel.

Reagovat



Reakce na #74697 (#74700)
Datum : 10.7.2007 15:06:39
Autor : neregistrovaný návštěvník Nevermind (195.47.39.**)
Předmět : RE:(2) RSS

Dgx je další kdo nezná RSS normy? Dgx se odjakživa chová jak kretén, nejenom v hospodě.

Reagovat



Reakce na #74697 (#74698)
Datum : 10.7.2007 14:21:14
Autor : neregistrovaný návštěvník Arthur Dent (212.158.147.**)
Předmět : RE:(2) RSS

Fajn, organizační věci máme tedy vyřízené. A teď: Je reálná potřeba dávat do RSS celé články?

Jako dlouholetý uživatel RSS, jako autor a správce blogovacího systému a jako autor RSS čtečky říkám: ANI NÁHODOU!

Reagovat



Reakce na #74686 (#74697)
Datum : 10.7.2007 12:40:02
Autor : neregistrovaný návštěvník dgx (77.240.188.**)
Předmět : RE: RSS

Články podle vzorce: X řeší něco, co JÁ už mám dávno vyrešené, a je to tak a tak (následuje pár chybných argumentů), baví mě tím/lituji ho/je to omezenec - ano, to jsou články Daniela Dočekala. Prý to kdysi bývala významná osobnost českého internetu :-)

K článku: formát RSS, se nepoužívá na to, k čemu byl určen. Vlastně pro současné použití je to velmi špatně navržený formát. Dlouho neobsahoval kolonku pro čas publikování příspěvku, dosud nemá kolonku pro jméno autora. Kdo je pak omezenec - ten kdo se drží omezeného návrhu RSS, nebo kdo jej přizpůsobí reálným potřebám?

Reagovat



Datum : 10.7.2007 10:05:34
Autor : neregistrovaný návštěvník Hellish (195.39.69.**)
Předmět : Omezenost některých jedinců

Internet nebyl nikdy určen k tomu, aby si na něj kdokoliv psal svoje názory a říkal tomu "blog". Reakce typu "já chci být Blogger, co je mi po původním účelu Internetu" je typickou ukázkou omezenosti některých jedinců.

Reagovat



Datum : 10.7.2007 9:55:53
Autor : neregistrovaný návštěvník Petr (88.146.191.**)
Předmět : Jednoduché řešení

Stačí udělat 'brutal SEO optimizet' web, kde se budou články z takových plných RSS načítat. Je pravděpodobné, že alespoň nějakou dobu budou při hledání ve vyhledávačích takové 'články' na lepší pozici, než originál. Třeba pak autorům takových RSS dojde, že opravdu nedělají to nejchytřejší na světě.

Nestává se to často, ale musím souhlasit s RH ;-)

Reagovat



Reakce na #74692 (#74693)
Datum : 9.7.2007 21:37:06
Autor : Volney
Předmět : RE:(2) Možná...

No, push nebo pull, dle mého, čím rychlejší připojení, tím méně zábran mám kliknout na odkaz, ať si na něm je cokoliv (pozor, nemam na mysli porno ani spam).

Proč bych si tedy měl tahat tuny neceho, o cem dopredu nevim nic? RSS je dle meho upozornovatko, na ktere mohu a nemusim reagovat.

V tom je jeho krasa.

Reagovat



Reakce na #74690 (#74692)
Datum : 9.7.2007 18:49:59
Autor : Daniel Dočekal
Předmět : RE: Možná...

Push zabil sám Push zejména díky tomu, že to nikdy "push" nebyl. Vždy to byl pull. A tehdejší snahy Microsoftu dokonce používaly něco, velmi podobného dnešnímu RSS.

RSS si člověk pořizuje pro snadnost a rychlost použití. Představa pořízení pár desítek kanálů z nich každý stahuje pár megabajtů dat je docela zvláštní představa. To si člověk může rovnou dělat miror titulní stránky plus jednu úroveň dovnitř. A nepotřebuje k tomu RSS.

Reagovat



Datum : 9.7.2007 18:39:26
Autor : Joker
Předmět :

Taky myslím, že plný obsah je v RSS na nic.

Dokonce jsem se setkal s přesně opačným názorem: napřed odmítavý postoj k samotné myšlence vůbec RSS na webu mít, což se teda nakonec změnilo, ale následně trvání na tom, aby souhrn v RSS byl co nejkratší.
Důvodem k tomuhle postoji byla argumentace, že se tím snižuje návštěvnost webu, protože někteří návštěvníci místo aby chodili na web, budou zprávy jen číst v RSS čtečce.

Jakkoliv je tahle argumentace řekl bych "zvláštní" a minimálně ta první polovina i nepravdivá, pořád beru RSS jako *přehled* článků, z nichž si vyberu ty zajímavé a potom je čtu. Z tohohle pohledu jsou celé články v RSS spíš na obtíž.

Reagovat



Datum : 9.7.2007 18:11:50
Autor : Volney (?) (85.70.68.**)
Předmět : Možná...

Možná jsem ignorant, ale nebyl to právě plný obsah který zabil někdejší vlnu push-služeb mezi lety 96-97?

Reagovat



Reakce na #74688 (#74689)
Datum : 9.7.2007 17:30:04
Autor : Daniel Dočekal
Předmět : RE: To bys snad ani nebyl ty

Reakce Snížka typu "já to chci, co je mi standardu" není bohuže nic jiného, než ukázka omezenosti a nezodpovědnosti.

Ptát se zda do RSS dávat či nedávat plný obsah je výzva k diskusi. Ale prohlásit "já to tam chci a tak budu ignorovat definici" je omezenost.

Reagovat



Datum : 9.7.2007 17:24:35
Autor : neregistrovaný návštěvník Ondřej Ficek (89.24.71.**)
Předmět : To bys snad ani nebyl ty

To bys snad ani nebyl ty Dane, kdybys někoho nenazval omezencem, že? Nicméně souhlas, v RSS nemá plný obsah co dělat.

Reagovat



Reakce na #74686 (#74687)
Datum : 9.7.2007 17:17:00
Autor : Daniel Dočekal
Předmět : RE: RSS

Ach ano, Atom je RSS, RSS je Atom, celé je to jenom přístup. Možná tvůj přístup Martine. A v tom případě hodně nezodpovědný. Nic jiného, nezodpovědný.

Reagovat



Datum : 9.7.2007 17:14:27
Autor : neregistrovaný návštěvník Martin Snížek (194.212.25.**)
Předmět : RSS

Když to čtu, říkám si, kdo moh tohle proboha napsat, a on to Daniel Dočekal, to bych neřekl :-)

Když už se tu bavíme o té omezenosti některých jedinců, tak mě přijde omezené spíš přemýšlet pouze v intencích technické implementace. A to, jestli bude RSS realizováno formou RSS 0.92, RSS 1.0, RSS 2.0 nebo Atom 1.0, je pouze otázka implementace - je to podobný rozdíl, jako jestli budeme text ukládat v UTF-8 nebo Windows-1250.

RSS už dnes neoznačuje ani tak technologii, jako spíše přístup, a v tomto významu také tento termín používám.

Reagovat



Datum : 9.7.2007 16:34:08
Autor : neregistrovaný návštěvník taras bulba (89.102.105.**)
Předmět : Pohádka

...A tak hodný strýček Dan zase zachránil svět. A basta!

Reagovat



Výpis stromově podle reakcí sestupně/vzestupně nebo Výpis sestupně/vzestupně (*)


( strana 1 z 1 ) ( celkem ohlasů: 21)

Vysvětlivky
(*) = volba bude zapamatována v cookies pro další použití (do další nové volby)

KRÁTCE A AKTUÁLNĚ @ FACEBOOK


Další témata
E-knihy (E-books)iPadZpoplatnění internetového obsahuGoogle AndroidNokia 900Marketing, reklama, PRWindows 7 tipy a trikyGoogle Wave  ■ Dragon Age Origins  ■ Chrome a Chromium  ■ World of Warcraft  ■ Google Buzz  ■ Ubuntu tipy a triky
ID: heslo: Registrace



REKLAMA




DOPORUČENÉ ČTENÍ


AKTUÁLNÍ TISKOVÉ ZPRÁVY

  • Check Point dosáhl ve 2. čtvrtletí 2010 rekordních hospodářských výsledků více
  • Personální novinky ve vedení společnosti Telefónica O2 více
  • O2 vyhlašuje 2. srpen Dnem pokrývačů více
  • TDP-Ontrack upozorňuje na úskalí imagingu více
  • SONY: Nové objektivy Alfa více
  • Citrix zavádí první nástavbové certifikáty v oboru virtualizace více
  • Telefónica O2 Czech Republic – Finanční výsledky za první pololetí 2010 více
  • Symantec zveřejnil výsledky červencové zprávy MessageLabs Intelligence Report více
  • Panasonic HM-TA1 - kamera, ke které nepotřebujete návod více
  • HDC-SDX1 - videokamera, se kterou si hravě poradíte vy i váš počítač více

.. JustIT.cz @ Twitter.com