Syndikering - Vastra-Gotalandsregionen/oppna-program-pubsub-service GitHub Wiki

Bakgrund

Den redaktionella processen inom en organisation av idag har ett antal utmaningar. Informationen man lämnar ut på sin webbplats ska bland annat vara relevant för målgruppen man vänder sig till, aktuell och kvalitetsgranskad.

Ofta finns information som man har anledning att återvinna från andra informationskällor till sin egen webbplats. Detta kan bero på att någon annan sitter på ämnets expertis, centralisering av utlämnande av specifik information mot en viss målgrupp eller att man lokalt i sin egen organisation inte har anledning att lägga resurser på något någon annan redan gjort.

Här finns behovet av att hämta in frukten av någon annans arbete. Dock uppstår frågetecken kring huruvida informationen man hämtar in över tid kommer vara aktuell, uppdaterad, kvalitetsgranskad eller ens tillgänglig.

Nedan följer exempel på hur detta ofta görs på webben idag.

Manuellt klipp och klistra

Redaktörer gör ibland lokala kopior av information från trovärdiga källor. Det kan vara allt från att återanvända text, bilder eller PDF-dokument.

Exempel:
<img src#"http://lh3.ggpht.com/_UyoX091sFhQ/S0Ia7bPHXhI/AAAAAAAAAB0/EL953uGo7WY/manuell_kopiering.png" alt"Manuell kopiering" />

Denna lösning kan i vissa specifika fall fungera. Normalfallet är dock att detta inte är en bra lösning.

Nackdelar:

  • Det skapas det en kopia frånkopplat originalet.
  • Om originalet uppdateras riskerar kopian att i samma stund bli inaktuell eller direkt missvisande.
  • Tidskrävande för redaktören att hålla reda på om informationen fortfarande är aktuell.

Hänvisa besökaren vidare

För att inte riskera att ha vilseledande, utdaterad eller felaktig information är det smidigt att på sin egen webbplats länka direkt till en trovärdig källa och överlåta informationens uppdaterande till källan.

Exempel:
<img src#"http://lh6.ggpht.com/_UyoX091sFhQ/S0Ia7bga7HI/AAAAAAAAABw/buPeVKbqo7A/lankar_till_kalla.png" alt"Länkar besökaren till informations källa" />

Nackdelar:

  • Informationskällan kan ändra adresserna till sin webbplats och då bryts ofta alla länkar. Besökaren du hänvisar vidare möts av allt från mer eller mindre pedagogiska felmeddelanden, eller kanske källans sökfunktion etc.
  • Tidskrävande för redaktörerna, särskilt då adresser helt eller delvis ändras hos de informationskällor som används.
  • Din webbplats besökare har nödvändigtvis ingen relation till, eller ens förtroende för, källan du hänvisar dem till.
  • Du skickar iväg en besökare som kan ha fler ärenden på din webbplats och du tappar kontrollen över besökarens upplevelse när den lämnar din webbplats.

Någon form av automatisk import av information

En teknisk lösning för att automatisk hämta viss information finns det några exempel på idag. Ibland erbjuder informationskällan att man kan utveckla en funktion som hämtar in den information man behöver. På så sätt blir informationen i dess senaste version tillgänglig för din webbplats och den kan också uppdateras när källan uppdaterar något.

Exempel:
<img src#"http://lh6.ggpht.com/_UyoX091sFhQ/S0Ia7L8v0II/AAAAAAAAABo/9hbDu5k8ymQ/automatisk-import.png" alt"Automatisk import nattetid" />


Fördelarna är att redaktörerna slipper göra jobbet manuellt, att informationen lämnas av den webbplats som besökaren valt att söka upp och att materialet kan uppdateras av sig självt.

Detta kan se ut som nedan när 1177.se erbjuder en tjänst för att importera artiklar till andra webbplatser som vill återvinna vårdrelaterad information.

<img src#"http://lh5.ggpht.com/_UyoX091sFhQ/S0Ib4jB0yzI/AAAAAAAAACI/grT61ozLwpM/1177-exempel_tumme.png" alt"1177.se är källan till informationen" border#"1" /> <img src"http://lh4.ggpht.com/_UyoX091sFhQ/S0Ib4vbLdUI/AAAAAAAAACE/Du7sOEEXYS8/VGR-exempel_tumme.png" alt#"vard.vgregion.se importerar samma texter från 1177.se" border"1" />

Nackdelar:

  • Är det den som kontaktar informationskällan först och lanserar idén som ska betala hela utvecklingen även om det tillkommer flera nyttjare av funktionen senare?
  • Någon kommer få förvaltningen av importen på sitt bord med allt vad det innebär.
  • Kostsamt då det med stor sannolikhet finns flera nyttiga informationskällor och då det sannolikt krävs flera olika importlösningar som alla löser samma grundbehov = att importera information.
    • Detta kompliceras också ytterligare av att varje källa kommer ha problem med att media såsom bilder, video som hör till information kan bli svår att få med (som i exemplet ovan då bilder filtreras bort då de annars skulle förstöra sidans bredd).
  • Det är inte säkert att det räcker med att uppdatera informationen nattetid via import.
    • I vissa fall är det avgörande att korrekt information skickas över så skyndsamt som möjligt. Tänk dig exempelvis att ett fel finns i en text som rådgör kring något som kan ha livsavgörande följder för en patient. Detta är en situation det inte är säkert att beställaren av importfunktionen förutsåg.
  • Informationen man hämtar in blir väldigt beroende av att importen från informationskällan fungerar som det är tänkt. Beroende på hur denna lösning konstrueras kan det medföra allt ifrån att besökaren möts av felmeddelanden på din webbplats till att din webbplats ändå har inaktuell information då importen plötsligt slutar att fungera.
  • Kan bli kostsamt att byta källa.

Idén med en automatiserad import som sådan är inte fel. Problemet är att det fortfarande finns ett antal potentiella brister som kan avskräcka både informationskällan och nyttjaren av en automatiserad import.

Lösningen är standarder och specifikt i detta fall syndikering för informationsutbytet.
Först en liten genomgång av vad syndikering är.

Vad är syndikering?

Syndikering och syndikat är inte speciellt vanliga ord i det svenska språket. Syndikat förklaras ungefärligen som: En sammanslutning av representanter/ombud

Slår man upp det på Google (med sökfrågan define: syndicate) beskrivs det med att vara en lös sammanslutning av parter som samarbetar mot ett gemensamt mål. Det exemplifieras ofta med hjälp av media som satt samarbete av information i system. The act of syndicating a news feature by publishing it in multiple newspapers etc simultaneously Källa: Wikipedia

Syndikering är publicering och prenumeration:

  • Publicering - egen organisation står som avsändare för information andra har eller kan ha behov av.
  • Prenumeration - egen organisation är mottagare av information som syndikeras av andra parter.

Med syndikering avses i detta sammanhang att ens egen organisation kan agera både som en nyhetsbyrå och en lokal tidning genom att samarbeta om information som flera har nytta av. Ibland är man mottagare av informationen, och ibland avsändare.

Att detta arbetssätt har uppstått bland nyhetsförmedlarna är troligen för att:

  • Det är för dyrt, och inte ens möjligt, att ha en egen reporter och fotograf på plats vid samtliga händelser över hela jorden.
  • Om någon vill återanvända en nyhet man själv bevakat kan man tjäna pengar genom att sälja informationen utan att det nödvändigtvis konkurrerar med ens egen verksamhet.
  • Mer aktuell information genom att man som lokal nyhetsförmedlare kan prenumerera på stora internationella nyheter och välja ut de som intresserar ens egna läsare.

Syndikering som koncept är relevant för den offentliga sektorns webbplatser. Organisationerna konkurrerar inte med varandra, man har olika specialiteter, är olika stora, har olika mycket resurser och har alla ett behov av att samarbeta för att inte flera ska göra samma jobb.

Syndikering har ett antal fördelar:

  • Notifiering Istället för att redaktören manuellt bevakar flertalet trovärdiga informationskällor med information möjliggörs notifiering om att ny relevant information finns att importera från en på förhand angiven källa. Detta möjliggör att även om endast ett dokument uppdaterats så meddelas prenumeranterna om att uppdatering finns.
  • Mer automatiserat och mindre jobb Redaktörer kan moderera information istället för att leta upp information för att sedan kopiera och klistra in.
  • Kvalitativ information och automatiserad uppdatering Om källan till informationen hittar en felaktighet eller av annan anledning uppdaterar materialet kan de som prenumererar på denna information få den uppdaterad av sig självt utan att redaktörer måste medverka.
  • Mer komplett utbud av information Mindre organisationer kan på sin egen webbplats erbjuda kvalitetssäkrad information från tredje part till sina medborgare utan att behöva hänvisa vidare till exempelvis 1177.se, Smittskyddsinstitutet med flera. Detta i sig gör det möjligt för medborgaren att ta del av informationen direkt från organisationen denne redan har en relation med.

Mest nytta av syndikering har man om det görs på ett standardiserat sätt - då löser man behovet en gång och kan använda samma mall för informationsutbyte när nya informationskällor ska bidra i syndikeringen.

Att syndikera information mellan webbplatser

Komponenter som behövs

Förutom de minst två webbplatserna som vill utbyta information så behövs en mellanhand för överförandet av information, även ett sätt för båda webbplatserna att prata med mellanhanden behövs. Mellanhanden kan i detta fall vara en neutral part i form av systemet Pubsubhubbub, och sättet är ett tillägg till publiceringssystemet som kan hantera standarden ATOM för att sända och ta emot information från hubben.

<img src#"http://lh6.ggpht.com/_UyoX091sFhQ/S0Ia7aS2EAI/AAAAAAAAABs/hY_g_nYa_M0/hub.png" alt"En informationskälla erbjuder sitt innehåll till en hub som sedan kan förmedla det vidare till prenumeranter" />


Vilket system som agerar mellanhand, eller hub, är i sig inte så viktigt förutsatt att det ska vara ett system som stödjer den mångfald av funktioner som behövs. Pubsubhubbub är ett sådant system som är tänkt att vara mellanhanden för att sprida RSS och ATOM-flöden mellan olika parter och fungerar också som notifieringstjänst genom att meddela prenumeranter när ny information finns tillgänglig. För att få exempelvis EpiServer att kunna använda Pubsubhubbub behöver ett plugin skapas efter de behov redaktionen har. Fördelen är att detta plugin sedan är generellt och går att återanvända för andra organisationer som också använder EpiServer. Tillkommer fler informationskällor kan de kopplas mot samma hub och används en annan hub kan denna läggas till i pluginet.

Information och metadata att syndikera

Just standarden ATOM är bra för att beskriva information då den utan att utökas innehåller mycket information för att beskriva mer än bara en artikels titel och innehåll. Bland annat finns även kategori, skribent och annan metadata som så gott som alltid finns och behövs i ett publiceringssystem.

Dock är det fortfarande så att parterna som ska utbyta information måste vara överens om vilken extrainformation som ska följa med syndikeringen. I nödfall kan det i respektive publiceringssystem mappas upp vilka termer som erbjuds av olika informationskällor och vad den lokala motsvarigheten är.

Den information som saknas i ATOM kan man själv utöka genom att tagga upp respektive tillägg man vill erbjuda. Exempel på detta kan vara:

  • Målgrupp (allmänheten, vårdgivare, etc)
  • Geografisk information
  • Källa
  • Granskningsreferenser
  • Versionsnummer
  • Datuminformation (revideringsdatum, publiceringsdatum)
  • Informationstyp (kontaktuppgift, kalenderinformation, etc)
  • Intern relation med annan information (nästa och föregående artikels adress)

Samtidigt är det bra att använda Microformats i de fall sådana finns tillgängliga, exempelvis kalenderinformation och kontaktuppgifter för att information då blir självbeskrivande.

Sammanfattning

Hubben, eller hubbarna, är lättare rent tekniskt att hantera då det blir mer förutsägbart hur mycket kapacitet de måste leverera och prestandan samlas på ett ställe. Man samlar denna ansträngning hos en specialiserad lösning istället för att ha onödig överkapacitet ute i respektive publiceringssystem och riskera driftstörningar hos både informationskällan och dess användare av importfunktionen.

Fördelarna är många jämfört med de mer klassiska lösningarna. Att en mer hållbar och lösare koppling görs mellan informationskällan och dess prenumeranter, och att det finns en standard att följa för plugins till nytillkomna publiceringssystem.

Pubsubhubbub tillsammans med plugin för publiceringssystem är definitivt en framkomlig väg för att på ett praktiskt sätt sköta informationsutbyte mellan olika parter.

⚠️ **GitHub.com Fallback** ⚠️