kodiranje revij (journals) - bavla/biblio GitHub Wiki

Opis Excelove datoteke citiranih revij

  • V spodnjem primeru vidimo kaj nam generira koda, ki jo najdemo na https://github.com/bavla/biblio/wiki/mark. Citiranja >=75.
  • Stolpec 5 (column 5) nam poda način, po katerem je bil članek citiran
  • Stolpec 3 (column 3) nam poda število citiranj po načinu, ki je predstavljen v stolpcu 5 (zanimajo nas predvsem visoke frekvence)
  • Stolpec 4 (column 4) je kodiran tako, da skupaj sestavi kratico, ki predstavlja prvi dve črki vsake besede v načinu citiranja članka v stolpcu 5

Opis postopka čiščenja podatkov

  • Preko spletnih strani https://www.ncbi.nlm.nih.gov/ , http://ulrichsweb.serialssolutions.com/ in Googlovih poizvedb sem ugotvaljal naslove revij, ki sem jih vpisoval v stolpec 6 (column 6)
  • Kar me je predvsem zanimalo je, katere revije so v stolpcu 4 kodirane enako, ampak so v resnici različne revije. Na osnovi ugotvaljanja različnih revij sem tudi kratice v stolpcu 4 kodiral različno, v smislu CI1 (svoja revija s kratico CI - Cinésiologie), CI2 (svoja revija s kratico CI - Circulation Journal)
  • Analizo omrežja citiranj revij bo storil na podlagi kodiranj v stolpcu 4

Primer: image