kodiranje revij (journals) - bavla/biblio GitHub Wiki
Opis Excelove datoteke citiranih revij
- V spodnjem primeru vidimo kaj nam generira koda, ki jo najdemo na https://github.com/bavla/biblio/wiki/mark. Citiranja >=75.
- Stolpec 5 (column 5) nam poda način, po katerem je bil članek citiran
- Stolpec 3 (column 3) nam poda število citiranj po načinu, ki je predstavljen v stolpcu 5 (zanimajo nas predvsem visoke frekvence)
- Stolpec 4 (column 4) je kodiran tako, da skupaj sestavi kratico, ki predstavlja prvi dve črki vsake besede v načinu citiranja članka v stolpcu 5
Opis postopka čiščenja podatkov
- Preko spletnih strani https://www.ncbi.nlm.nih.gov/ , http://ulrichsweb.serialssolutions.com/ in Googlovih poizvedb sem ugotvaljal naslove revij, ki sem jih vpisoval v stolpec 6 (column 6)
- Kar me je predvsem zanimalo je, katere revije so v stolpcu 4 kodirane enako, ampak so v resnici različne revije. Na osnovi ugotvaljanja različnih revij sem tudi kratice v stolpcu 4 kodiral različno, v smislu CI1 (svoja revija s kratico CI - Cinésiologie), CI2 (svoja revija s kratico CI - Circulation Journal)
- Analizo omrežja citiranj revij bo storil na podlagi kodiranj v stolpcu 4
Primer:
