Project Status Reports - noolahamfoundation/ocr-tooling GitHub Wiki

Table of Contents

சனவரி 29 2017

செயற்திட்ட மேலாளரின் குறிப்புகள்-12

நூலக நிறுவனத்தின் எழுத்துணரியாக்கப் பணி குறித்தச் செய்திகள்-12 -- 29 சனவரி 2017 அணித்தரவுகள் 117-124 வரையிலான மின்னூல்களில் 55%மின்னூல்களில் எழுத்துணரியாக்கம் நிறைவு பெற்றன. பெரும்பாலான நூல்களுக்கு தனிக்கவனம் செலுத்தப்பட வேண்டிய சூழ்நிலை எழுந்தது. BATCHOCR.py நிரலை இயக்குவதில் தடை அவ்வப்போது ஏற்பட்டதால், ஒவ்வொரு நூலுக்குமான தனிக்கவனம் செலுத்தப்பட்டது.35%நூல்கள் அளிவில் பெரியனவாக இருந்தன.

ஒரு அணித்தரவை, இரு பகுதிகளாக, 50-50நூல்களாகப் பிரித்து, ஒவ்வொன்றினையும், தனித்தனியே, இரு தொகுதிகளாக, எழுத்துணரியாக்கம் செய்யப்பட்டன. அனைத்து htmlகோப்புகளும்,கூகுள் நினைவகத்தில், வழமை போல, அதற்கே உரிய கோப்புரைக்குள் நகர்த்தப்பட்டன.

மேலும், பல நூலக ஆவணங்கள் கூகுள் விரிதாளில் இருந்து 'கிட்அப்'(Github)க்கு நகர்த்தப்பட்டன. எடுத்துக்காட்டக, https://github.com/noolahamfoundation/guiding-documents/wiki/Noolaham-Foundation%E2%80%99s-Technology-Roadmap

சனவரி 15 2017

செயற்திட்ட மேலாளரின் குறிப்புகள்-11

நூலக நிறுவனத்தின் எழுத்துணரியாக்கப் பணி குறித்தச் செய்திகள்-11 -- 15 சனவரி 2017 அணித்தரவுகள் 106-117 வரையிலான மின்னூல்களில் 69%மின்னூல்களில் எழுத்துணரியாக்கம் நிறைவு பெற்றன. பெரும்பாலான நூல்களுக்கு தனிக்கவனம் செலுத்தப்பட வேண்டிய சூழ்நிலை எழுந்தது. BATCHOCR.py நிரலை இயக்குவதில் தடை அவ்வப்போது ஏற்பட்டதால், ஒவ்வொரு நூலுக்குமான தனிக்கவனம் செலுத்தப்பட்டது.15%நூல்கள் அளிவில் பெரியனவாக இருந்தன.

அதனால் வழங்கியின் நினைவகக் கொள்ளளவு திறனை,கவனிக்க வேண்டிய சூழ்நிலை இருந்தது. எடுத்துக்காட்டாக, ஒரு அணித்தரவை, இரு பகுதிகளாக, 50-50நூல்களாகப் பிரித்து, ஒவ்வொன்றினையும், தனித்தனியே, இரு தொகுதிகளாக, எழுத்துணரியாக்கம் செய்யப்பட்டன. அனைத்து htmlகோப்புகளும்,கூகுள் நினைவகத்தில் அதற்கே உரிய கோப்புரைக்குள் நகர்த்தப்பட்டன. இதவரை அணித்தரவு 001-117வரையிலான, 11700நூல்கள் எழுத்துணரியாக்கம் செய்ய ஈடுபடுத்தப்பட்டன. அவற்றில் ஏறத்தாழ 25%நூல்களை மறுபடியும் எழுத்துணரியாக்கம் செய்ய வேண்டிய நிலை இருக்கும்.

முதலில் உருவாக்கப்பட்ட கூகுள் விரிதாள்கள் பத்து பத்தாக, ஒரு கோப்புரைக்குள்ளும், அதனுள் இறுதியாக உருவாக்கப்பட்ட 100நூல்களின் htmlகோப்புகள் துணைக்கோப்புரைகளுக்கு உள்ளும் சேமிக்கப்பட்டு, NOOLAHAM-batchdata-s என்ற கோப்புரைக்குள் இடப்பட்டு பகிரப்பட்டுள்ளன. இவைகளின் நிலைகளை கீழ்காணும் கூகுள் விரிதாளில் காணலாம்.

https://docs.google.com/spreadsheets/d/1rb5OWivsOmNhL50VLvFMdY1Mc7P0K1o3Iz76_7YUgE4/edit?usp=sharing

சனவரி 1 2017

செயற்திட்ட மேலாளரின் குறிப்புகள்-10

நூலக நிறுவனத்தின் எழுத்துணரியாக்கப் பணி குறித்தச் செய்திகள்-10 -- 1 சனவரி 2017

+அணித்தரவுகள் 100-105 வரையிலான மின்னூல்களில் 65%மின்னூல்களில் எழுத்துணரியாக்கம் நிறைவு பெற்றன. பெரும்பாலான நூல்களுக்கு தனிக்கவனம் செலுத்தப்பட்டன. BATCHOCR.py நிரலை இயக்குவதில் தடை அவ்வப்போது ஏற்பட்டதால், ஒவ்வொரு நூலுக்குமான தனிக்கவனம் செலுத்த வேண்டியிருந்தன.25%நூல்கள் அளிவில் பெரியனவாக இருந்தன. அதனால் வழங்கியின் நினைவகக் கொள்ளளவு திறனை அடிக்கடி கவனிக்க வேண்டியிருந்தது. எடுத்துக்காட்டாக, அணித்தரவு 105-ஐ இரு பகுதிகளாக, 50-50நூல்களாகப் பிரித்து, எழுத்துணரியாக்கம் செய்யப்பட்டன. அனைத்து htmlகோப்புகளும்,கூகுள் நினைவகத்தில் அதற்கே உரிய கோப்புரைக்குள் நகர்த்தப்பட்டன.

திசம்பர் 25 2016

செயற்திட்ட மேலாளரின் குறிப்புகள்-9

நூலக நிறுவனத்தின் எழுத்துணரியாக்கப் பணி குறித்தச் செய்திகள்-9 -- 25 திசம்பர் 2016 +அணித்தரவுகள் 90-99வரையிலான மின்னூல்களில் 70%மின்னூல்களில் எழுத்துணரியாக்கம் நிறைவு பெற்றன. பெரும்பாலான நூல்களுக்கு தனிக்கவனம் செலுத்தப்பட்டன. BATCHOCR.py நிரலை இயக்குவதில் தடை அவ்வப்போது ஏற்பட்டதால், ஒவ்வொரு நூலுக்குமான தனிக்கவனம் செலுத்த வேண்டியிருந்தன. மேலும் பெரும்பாலான நூல்கள் ஏறத்தாழ 300 பக்கங்கள் கொண்டனவாக இருந்தன. அதில் ஓரிரு பக்கங்கள் விடுபட்டாலும், html கோப்புகள் உருவாக்குவதில் தடைஏற்பட்டன. மாற்றப்பட்ட கோப்புகள் அனைத்தும் கூகுள் நினைவகத்தில் அதற்கே உரிய கோப்புரைக்குள் நகர்த்தப்பட்டன.

திசம்பர் 11 2016

செயற்திட்ட மேலாளரின் குறிப்புகள்-8

நூலக நிறுவனத்தின் எழுத்துணரியாக்கப் பணி குறித்தச் செய்திகள்-8 -- 11 திசம்பர் 2016

+கடந்த 7 நாட்களில் அணித்தரவுகள் 80-89வரையிலான மின்னூல்களில் 80% எழுத்துணரியாக்கப்பணிகள் நிறைபெற்றன. do_ocr.py நிரலை 10%நூல்களுக்குத் தனித்தனியே இயக்க வேண்டி இருந்தது. அதனால் தானியக்க இயக்கத்தினை நிறுத்தி, மீ்ண்டும் BATCHDATA.csv மாற்றி, தானியக்கம் செய்ய வேண்டி இருந்தது. இதனால் ஒவ்வொரு அணியின் எழுத்துணரியாக்கம் முடிந்து, இறுதியில் இயக்கப்படும் checkResult.py இயக்குவதில் இடர் ஏற்பட்டுள்ளது. அதற்காக கூகுள் ஆவணங்களை மேலாண்மை செய்ய, அதன் api பயன்பாடுகளைக் இணையத்தில் கவனித்து வருகிறேன்.

+எழுத்துணரியாக்கம் நடைபெறும் வழங்கியிலிருந்து, html கோப்புகள், தற்போது, நேரடியாக நூலக நிறுவனத்தின் பணிபுரியும் சிலருடன் பகிரப்பட்ட கூகுள் கோப்புரையில், துணைக்கோப்புரைகளாக நகர்த்தப்படுகின்றன. இதற்கு சென்ற வராம் கூறிய rlone மிகவும் உதவுகிறது.

+இக்குறிப்புகள் அனைத்தும் ஒரு கூகுள் விரிதாளில் இற்றைப்படுத்தப்படுகின்றன. அது html விடுபட்ட நூல்களை எழுத்துணரியாக்கம் செய்யவும், நூலக இணையத்தில் உள்ள html கோப்புகளைப் பற்றியும் நினைவில் நிறுத்தும்.

திசம்பர் 4 2016

செயற்திட்ட மேலாளரின் குறிப்புகள்-7

நூலக நிறுவனத்தின் எழுத்துணரியாக்கப் பணி குறித்தச் செய்திகள்-7 -- 4 திசம்பர் 2016.

+ கடந்த 7 நாட்களில்,அணித்தரவுகள் 68 முதல் 79வரையிலான மின்னூல்களில்,70%-80% மின்னூகளுக்கு மட்டுமே எழுத்துணரியாக்கம் செய்யப்பட்டன. சில நூல்களுக்கு, குறிப்பாக அணித்தரவின் கடைசி மின்னூலுக்கு, do_ocr.py இயக்கும் போது, எழுத்துணரியாக்கம் இனிதே நிறைபெற்று, அதற்கும் உரிய html கோப்புகள் உருவானது.

+ கடந்த வாரம் கூறியபடி நமது கணினியிலிருந்து/வழங்கியிலிருந்து, கூகுள் நினைவகத்திற்கு (google drive) கோப்புகளைத் தானியக்க முறையில் நகர்த்துவதற்கான முறை எளிமைபடுத்தப்பட்டது. அந்நுட்பம் யாவருக்கும் பயன்படும் படி, இணையத்தில் அலசியபோது, https://github.com/ncw/rcloneஎன்ற திட்டப்பகுதி கிடைத்தது. இந்த rclone திட்டத்தில் சில நூறு பங்களிப்பாளர்கள் இயங்குகின்றனர். அதனால் பல இணைய நினைவகத்திற்கு நமது கோப்புகளை தானியக்கமாக நகர்த்த முடியும்.

நவம்பர் 27 2016

செயற்திட்ட மேலாளரின் குறிப்புகள்-6

நூலக நிறுவனத்தின் எழுத்துணரியாக்கப் பணி குறித்தச் செய்திகள்-5 -- 27 Nov 2016

+ கடந்த 7 நாட்களில்,அணித்தரவுகள் 58முதல் 68வரையிலான மின்னூல்களில்,60%-70% மின்னூகளுக்கு மட்டுமே எழுத்துணரியாக்கம் செய்யப்பட்டன. நூல்களை எழுத்துணரியாக்கம் செய்யும் நேரத்தை விட, இதழ் தொகுப்புகளை எழுத்துணரியாக்கம் செய்ய அதிக நேரம் தேவைப்படுகிறது.

+ html கோப்புகள் வழமைபோல, கூகுள் நினைவகத்தில் தனித்தனி கோப்புரைகளுக்குள் சேமிக்கப்பட்டன. முன்பு ஒரு அணித்தரவுக்குரிய, html கோப்புகளை, கூகுள் நினைவகத்தில் பதிவேற்ற, எழுத்துணரியாக்க வழங்கியிலிருந்து, எனது கணினிக்கு மாற்றி, பிறகு எனது கணினியிலிருந்து கூகுள் நினைவகத்தில் பதிவேற்றுவேன். இதற்கு ஏறத்தாழ 70 நிமிடங்கள் தேவைப்பட்டன. இப்பொழுது வழங்கியிலிருந்து நேரடியாக, கூகுள் நினைவகத்திற்கு பதிவேற்ற 10 நிமிடங்களே போதும்.

+தற்போது html கோப்புகள் நேரடியாக வழங்கியிலிருந்து, கூகுள் நினைவகத்தின் உரிய கோப்புரையில் பதிவேற்றப்படுகின்றன. எப்படியெனில்,gdmkdir.py, gdput.py ஆகிய எழுத்துணரியாக்க நிரலாக்கங்கள், html கோப்புகளின் இடமாற்றத்திற்கு உதவின. இதற்குரிய உரையாடல்கள் சீனிக்கும், எனக்கும் இடையே அலைப்பேசியிலும்(~30நிமி), மின்னஞ்சலிலும்(10-12முறை) நடைபெற்றன. எனது வினாக்களுக்கு விடையும், உரிய வழிகாட்டுதலும் தந்த சீனிக்கு மிக்க நன்றி. பலருக்கும் பயன்படும்படி, இதனை மாற்ற வேண்டும்.

நவம்பர் 20 2016

செயற்திட்ட மேலாளரின் குறிப்புகள்-5

நூலக நிறுவனத்தின் எழுத்துணரியாக்கப் பணி குறித்தச் செய்திகள்-5 -- 20 Nov 2016

+ கடந்த 7 நாட்களில், முதல் மூன்று நாட்கள் மெய்நிகர் வழங்கி சரியாக செயற்படவில்லை. இருப்பினும், அணித்தரவு 51முதல் 57வரையிலான மின்னூல்கள் எழுத்துணரியாக்கம் மேற்கொள்ளப்பட்டன. இவற்றில் 60%-70% மின்னூகளுக்கு மட்டுமே எழுத்துணரியாக்கம் முடிக்கப்பட்டன. தோன்றிய இடர்கள் வேறுபட்டு காணப்படுகின்றன.

+ 7 அணித்தரவுகளுக்கும் உரிய html கோப்புகள் வழமைபோல, கூகுள் நினைவகத்தில் தனித்தனி கோப்புரைகளுக்குள் சேமிக்கப்பட்டன.

+ https://github.com/noolahamfoundation/ocr-tooling/issues/5 என்ற வழு பதியப்பட்டுள்ளது.

நவம்பர் 13, 2016

செயற்திட்ட மேலாளரின் குறிப்புகள்-4

நூலக நிறுவனத்தின் எழுத்துணரியாக்கப் பணி குறித்தச் செய்திகள்-4 -- 13 Nov 2016 அனைவரையும் சந்திப்பதிலே மகிழ்ச்சி. + கடந்த 7 நாட்களாக, புதிய 1000 நூல்களுக்கு எழுத்துணரியாக்க முயற்சிகள் நடைபெற்றன. மேலும், இடருள்ள 103 நூல்களுக்கு எழுத்துணரியாக்க முயற்சிகள் வெற்றிகரமாக முடிக்கப்பட்டன. இதுவரை அணித்தரவுகள் 1-50 (50X100) நூல்களுக்கு எழுத்துணரியாக்கப் பணிகள் முடிவடைந்துள்ளன. இதில் ஏறத்தாழ 10 % பணிகள் முழுமையடையாமல் உள்ளன. அவற்றையும் முடிப்பதற்கான முயற்சிகள் மேற்கொள்ளப்பட்டு வருகின்றன.

+ இதுவரை வெற்றிகரமாக உருவாக்கப்பட்ட, அனைத்து html கோப்புகளும், கூகுள் நினைவகத்தில் (Google drive) படத்தில் காட்டியுள்ளபடி ஏற்றப்பட்டுள்ளன. முதல் படத்தில் BATCHDATAs 01-10 என்பது, பத்து அணித்தரவுகள் ஆகும். இதனுள் ஏறத்தாழ 1000 html கோப்புகள் உள்ளன. இதுவே, 2,3 வது படங்களிலுள்ளன.


​மேகக்கணிமையில் அமைந்துள்ள, கூகுள் நினைவகத்தின் APP, லினக்சு வகைக் கணினிகளுக்கு இல்லை. அலைப்பேசிகளுக்கும், வின்டோசு இயக்குதள வகை கணினிகளுக்கு மட்டுமே உள்ளன. எனவே, எனக்கு மேற்கண்டவாறு கோப்புரைகளில், ஆவணங்களை அமைப்பதில் சில இடர்கள் ஏற்பட்டன. ஏனெனில், இணைய இணைப்பு வேகம் அப்படி! 100 html பதிவிறக்க 10-15 நிமிடங்கள் ஆகிறதென்றால், அவற்றை கூகுளின் நினைவகத்தில் பதிவேற்ற 60 நிமிடங்கள் ஆகிறது.

+ எனது அனைத்துப்பணிகளையும்(விக்கிமீடியா&நூலகம்) கட்டற்ற மென்மியங்களில்(Freedom softwares) மட்டுமே செய்து முடிக்கிறேன். இப்பங்களிப்புகளுக்கு, உறுதுணையாக இருக்கும் சீனிவாசனுக்கும், அவரது துணைவியாருக்கும் மிக்க நன்றி. எனது நோக்கத்தை செவ்வனே செய்ய, பல்வேறு பணிகளுக்கும் இடையில், அவர்தம் தரும் ஆலோசனைகளும், நிரல் மேம்பாட்டு உதவிகளும் பேருதவியாக இருக்கின்றன.

+மெய்நிகர் வழங்கியில் இருந்து நேரடியாக, கூகுளின் நினைவகத்திற்கு html கோப்புகளையும், ஒவ்வொரு 100 கோப்புகளுக்கும் உரிய மூன்றுவிதமான csv கோப்புகளையும், இன்னும் எளிதாக ஒருங்கிணைக்க முயற்சிகள் மேற்கொள்ளப்பட்டு வருகின்றன.

மீண்டும் அடுத்த ஞாயிறு சந்திப்போம். வணக்கம். ​

நவம்பர் 6, 2016

செயற்திட்ட மேலாளரின் குறிப்புகள்-3

உங்கள் அனைவரையும் மீண்டும், இம்மடல் வழியே சந்திப்பதிலே மகிழ்ச்சியடைகிறேன். இது நூலக நிறுவனத்தின் எழுத்துணரியாக்கப் பணி குறித்த, மூன்றாவது செய்தியறிக்கை .

+ இதுவரை அணித்தரவுகள் 11 முதல் 50 வரையிலான நூல்களுக்கு html கோப்புகள் உருவாக்கப்பட்டுள்ளன. ஒவ்வொரு அணித்தரவிலும் 100 நூல்கள் அடங்கும். ஆக 40X100=4000 நூல்களுக்கு எழுத்துணரியாக்க பணிகள் மேற்கொள்ளப்பட்டுள்ளன.

+ இதில் 10% நுல்களில், html கோப்புகள் உருவாக்க ஏற்படும் வழுக்கள் குறித்த சோதனைகள் செய்யப்பட்டன.


+ மற்றொரு மெய்நிகர் வழங்கியில், எழுத்துணரியாக்கம் செய்ய இயலாததற்கான காரணம் இன்னும் அறியப்படவில்லை.

இந்த சிறு சிறு தடைகள் நீங்க இன்னும் சிலவாரங்கள் ஆகலாம். எனினும், அடுத்த வாரம் அதிக எண்ணிக்கையில் நூல்கள் எழுத்துணரியாக்கம் செய்ய முயற்சிகள் மேற்கொள்ளப்படும். வணக்கம்.

ஒக்ரோபர் 30, 2016

செயற்திட்ட மேலாளரின் குறிப்புகள்-2

உங்கள் அனைவரையும் மீண்டும், இம்மடல் வழியே சந்திப்பதிலே மகிழ்ச்சியடைகிறேன். இது நூலக நிறுவனத்தின் எழுத்துணரியாக்கப் பணி குறித்த, இரண்டாவது செய்தியறிக்கை . தீப ஒளி திருநாள் விடுமுறை என்பதால், இந்த அறிக்கை 10 மணிநேரம் தாமதமாகத் தருகிறேன்.

+ இதுவரை அணித்தரவுகள் 21-26, 31-50 நூல்களுக்கு html கோப்புகள் உருவாக்கப்பட்டுள்ளன. ஒவ்வொரு அணித்தரவிலும் 100 நூல்கள் அடங்கும். ஆக 26X100=2600 நூல்கள் + இதில் 10% நுல்களில், html கோப்புகள் உருவாக்க ஏற்படும் வழுக்கள் குறித்த சோதனைகள் செய்யப்பட்டன. + மெய்நிகர் வழங்கியில் ஏற்படும் நினைவகப்பற்றாக்குறை அவ்வப்போது குறைக்க clean.sh நிரல் மேம்படுத்தப்பட்டது. மேலும், கூகுள் ஆவணங்களை விரைந்து உருவாக்குவதற்கான வழிமுறைகள் உருவாக்கப்பட்டன. + மற்றொரு மெய்நிகர் வழங்கியில், எழுத்துணரியாக்கம் செய்ய இயலாததற்கான காரணம் அறிய முயற்சி மேற்கொள்ளப்பட்டுள்ளது. இந்த சிறு சிறு தடைகள் நீங்க இன்னும் சிலவாரங்கள் ஆகலாம். எனினும், அடுத்த வாரம் அதிக எண்ணிக்கையில் நூல்கள் எழுத்துணரியாக்கம் செய்ய முயற்சிகள் மேற்கொள்ளப்படும். வணக்கம்.

வழிகாட்டுநரின் கருத்துக்கள்

ஆயிரம் படைப்புகளை உள்ளடக்கிய 41 - 50 தொகுதிகளுக்கான (batches) தரவேற்றம்/விக்கி இணைப்பு இணைப்பு முடிந்துள்ளது. துப்பரவு, திருத்த வேலைகள் உள்ளன. கணிசமான படைப்புகள் fail ஆகியுள்ளன. அவை பற்றி பின்னர் நாம் மேலும் ஆய்வோம்.

தற்போது 31 - 40 வரையான தொகுதிகளுக்கான எழுத்துணரியாக்கப் பணிகள் நடந்து வருகின்றன. அது அரைவாசிக்கு மேல் முடிந்துள்ளன.

எமது நிரல்களை கட்டற உரிமத்தில் இங்கு சேர்த்துள்ளோம்: https://github.com/noolahamfoundation/ocr-tooling.

பல வழுக்கள் தீர்க்கப்பட்டுள்ளன. நிரல் பதிப்புக் கட்டுப்பாட்டுக்குள் வந்துள்ளது. எமது செயலாக்கம் தெளிவுபெற்றுள்ளது. எனவே எமது வேகம் அதிகரிக்கும் என்று எதிர்பாக்கிறோம்.

எமது செயற்திட்ட வரைவை கிட்கப்புக்கு நகர்த்துவது பற்றி சிந்தித்து வருகிறோம்.

செயற்திட்ட மேலாளரின் குறிப்புகள்-1

இம்மடல் வழியே உங்களைச் சந்திப்பதிலே மகிழ்ச்சி. இது எனது முதற்மடல் என்பதால் சற்று விரிவாகத் தெரிவிக்க விரும்புகிறேன்.

நூலகம் தளத்தில் ஏறத்தாழ 28000 நூல்கள் உள்ளன. அவற்றில் 18,000 நூல்கள் அணியமாக உள்ளன. மற்றவைகளை மேம்படுத்தி வருன்றனர். முதற்கட்டமாக, அணியமாக உள்ள நூல்களை, எழுத்துணரியாக்கம் செய்ய உள்ளோம்.

+ நூலகத்தளத்தில் ஒவ்வொரு 100 நூல்களுக்கும், அட்டவணை வடிவத்தில் ஒரு இணையப்பக்கமாக உள்ளது. அந்த அட்டவணையில், நூல்களின் வரிசை எண், நூலின் ஆசிரியர் பெயர் இடம்பெற்றுள்ளது. பிற நூல்களுக்கான அனைத்து இணைப்புகளும், அந்த ஒரு பக்கத்திலேயே அமைந்துள்ளன.

+ கூகுள் எழுத்துணரியாக்க மேலாண்மை செய்ய, ஒவ்வொரு 100 நூல்களுக்கும் ஒரு கூகுள் விரிதாள் உருவாக்கப்படுகிறது. ஒவ்வொரு விரிதாளிலும், மூன்று வெவ்வேறு இலக்குகளை முடித்தவுடன் தரவுகள், 9 கட்டங்களில் நிரப்பப்படுகிறது. 1. எழுத்துணரியாக்கம் 100 நூல்களில் எது விடுபட்டுள்ளது என்பதை அறிய. 2. எழுத்துணரியாக்கம் செய்ய தேவையான நூலின் விவரங்கள். 3. எடுக்கப்பட்ட விவரம் அதனதன் நூலகபக்கத்துடன் சரிபாக்க தேவையான குறிப்புகள்.

+ஒவ்வொரு கூகுள் நினைவகத்தில் இந்த ஆவணங்கள் பேணப்பட்டு வருகின்றன. இம்மாதத்தில் இதுவரை 1500நூல்களுக்கு எழுத்துணரியாக்கம் செய்யப்பட்டுள்ளன. இந்த எழுத்துணரியாக்கம், html கோப்புகளாக மாற்றப்பட்டு, ஒரு கோப்புரைக்கு 100 கோப்புகளென, கூகுள் நினைவகத்தில் சேமிக்கப்பட்டு வருகின்றன.

+ பிறகு, ஒவ்வொரு html கோப்பும் அதற்கே உரிய நூலக நுற்பக்கத்தில் பதிவேற்றப்படுகின்றன. எடுத்துக்காட்டாக, http://www.noolaham.org/wiki/index.php/%E0%AE%9A%E0%AF%81%E0%AE%AE%E0%AF%88%E0%AE%95%E0%AE%B3%E0%AF%8D

+ எழுத்துணரியாக்கம் நடக்கத்தேவையான, நிரலாக்க நுட்பம் குறித்தவைகளைச் செவ்வனே செய்ய, இத்திட்டம் தொடங்கிய நாள்முதல் இன்று வரை, என்னுடன் 5-6மணிநேரம் உரையாடல்களை நற்கீரன் நிகழ்த்தியுள்ளார். நானும் எனது பணியை சிறக்க, அவரது ஆலோசனைப்படியும், வழிகாட்டுதல் படியும், கற்று இயங்கி வருகிறேன்.

+ எழுத்துணரியாக்கம் செய்யா நூல்களுக்கும் செய்யத் தேவையானத் தரவுகளை, கூகுள் விரிதாளில் கோர்த்து வருகிறேன்.

⚠️ **GitHub.com Fallback** ⚠️