CleanUpWiki_v6 - itnett/FTD02H-N GitHub Wiki
Feilmeldingen du ser, OSError: [Errno 22] Invalid argument
, oppstår fordi filnavnet som brukes inneholder ugyldige tegn for et filnavn på Windows. Spesielt inneholder filnavnet tegn som ?
og &
, som ikke er tillatt i Windows-filnavn.
For å løse dette problemet, må vi endre hvordan filnavnene genereres i skriptet. Vi bør fjerne eller erstatte ugyldige tegn fra filnavnene før de brukes til å lagre filer.
wiki_code_migration.py
Oppdatert Her er en oppdatert versjon av skriptet der ugyldige tegn fjernes fra filnavnene:
import os
import re
import shutil
import subprocess
import yaml
import logging
import traceback
from datetime import datetime
import stat
# Setup logging
logging.basicConfig(filename="C:\\WikiMigration\\migration.log", level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")
def log(message):
logging.info(message)
print(message)
def log_exception(e):
log(f"Exception occurred: {str(e)}")
log(traceback.format_exc())
def load_input_config(file_path):
try:
with open(file_path, 'r', encoding='utf-8') as file:
config = yaml.safe_load(file)
validate_config(config)
log(f"Loaded configuration from {file_path}")
return config
except Exception as e:
log_exception(e)
raise
def validate_config(config):
required_keys = ['wiki_repo_url', 'dump_directory', 'code_repo_url', 'code_repo_directory']
for key in required_keys:
if key not in config:
raise ValueError(f"Missing required config key: {key}")
if not config[key]:
raise ValueError(f"Config key {key} cannot be empty.")
log("Configuration validated successfully.")
def handle_remove_readonly(func, path, exc):
os.chmod(path, stat.S_IWRITE)
func(path)
def run_git_command(commands, cwd):
result = subprocess.run(commands, cwd=cwd, text=True, stdout=subprocess.PIPE, stderr=subprocess.PIPE)
if result.returncode != 0:
log(f"Git command failed: {' '.join(commands)}")
log(f"stdout: {result.stdout}")
log(f"stderr: {result.stderr}")
raise subprocess.CalledProcessError(result.returncode, commands)
return result.stdout
def sanitize_filename(filename):
# Fjern eller erstatt tegn som ikke er tillatt i Windows-filnavn
return re.sub(r'[<>:"/\\|?*&]', '_', filename)
def clone_wiki_repo(wiki_repo_url, target_directory):
try:
if os.path.exists(target_directory):
shutil.rmtree(target_directory, onerror=handle_remove_readonly)
os.makedirs(target_directory)
run_git_command(["git", "clone", wiki_repo_url, target_directory], cwd=target_directory)
log(f"Cloned Wiki repository to {target_directory}")
except Exception as e:
log_exception(e)
raise
def process_wiki_files(wiki_dir, code_repo_url, code_repo_dir):
try:
for root, dirs, files in os.walk(wiki_dir):
for file in files:
if file.endswith(".md"):
wiki_filepath = os.path.join(root, file)
with open(wiki_filepath, 'r', encoding='utf-8') as f:
content = f.read()
code_blocks = re.findall(r'```(.*?)\n(.*?)```', content, re.DOTALL)
updated_content = content
for idx, (lang, code) in enumerate(code_blocks):
code_filename = sanitize_filename(f"{os.path.splitext(file)[0]}_snippet_{idx+1}.{lang}")
code_filepath = os.path.join(code_repo_dir, code_filename)
with open(code_filepath, 'w', encoding='utf-8') as code_file:
code_file.write(code.strip())
github_link = f"[{code_filename}]({code_repo_url}/blob/main/{code_filename})"
updated_content = updated_content.replace(f"```{lang}\n{code}```", github_link)
with open(wiki_filepath, 'w', encoding='utf-8') as f:
f.write(updated_content)
log(f"Processed {wiki_filepath} and moved code to {code_repo_dir}")
except Exception as e:
log_exception(e)
raise
def update_changelog(code_repo_dir, log_message):
try:
changelog_path = os.path.join(code_repo_dir, "CHANGELOG.md")
timestamp = datetime.now().strftime('%Y-%m-%d %H:%M:%S')
log_entry = f"{timestamp} - {log_message}\n"
with open(changelog_path, 'a' if os.path.exists(changelog_path) else 'w', encoding='utf-8') as changelog_file:
if not os.path.exists(changelog_path):
changelog_file.write("# CHANGELOG\n\n")
changelog_file.write(log_entry)
log(f"Updated CHANGELOG.md with: {log_message}")
except Exception as e:
log_exception(e)
raise
def init_commit_code_repo(code_repo_dir, commit_message):
try:
if not os.path.exists(os.path.join(code_repo_dir, ".git")):
run_git_command(["git", "init"], cwd=code_repo_dir)
log("Initialized a new git repo.")
else:
log("Git repo already initialized.")
run_git_command(["git", "add", "."], cwd=code_repo_dir)
run_git_command(["git", "commit", "-m", commit_message], cwd=code_repo_dir)
log(f"Committed changes with message: {commit_message}")
except Exception as e:
log_exception(e)
raise
def main():
try:
config = load_input_config("input.yml")
wiki_repo_url = config['wiki_repo_url']
dump_directory = config['dump_directory']
code_repo_url = config['code_repo_url']
code_repo_directory = config['code_repo_directory']
clone_wiki_repo(wiki_repo_url, dump_directory)
process_wiki_files(dump_directory, code_repo_url, code_repo_directory)
update_changelog(code_repo_directory, "Moved code from Wiki to code repository.")
init_commit_code_repo(code_repo_directory, "Initial commit: Imported code from Wiki.")
except Exception as e:
log_exception(e)
raise
if __name__ == "__main__":
main()
Oppsummering av endringer:
-
Sanitizing filnavn:
- Funksjonen
sanitize_filename
erstatter ugyldige tegn i filnavn (som<>:"/\|?*&
) med_
. Dette sikrer at filnavnene er gyldige på Windows.
- Funksjonen
-
Oppdatert kode:
- Bruker
sanitize_filename
når filnavn genereres for å sikre at de er gyldige.
- Bruker
Kjøring av skriptet:
- Kjør CMD som administrator.
- Kjør det oppdaterte skriptet:
python C:\WikiMigration\wiki_code_migration.py
Dette skriptet bør nå kunne håndtere alle filer, inkludert de som tidligere forårsaket problemer på grunn av ugyldige filnavn. Skriptet vil nå korrekt flytte koden til code_repo_directory
og oppdatere Wiki-sidene med lenker til den nye koden.