인셔셔RSS 관심 있는 블로그, 뉴스, 기술 정보를 효율적으로 추적하고 읽으세요
원문 읽기 InertiaRSS에서 열기

추천 피드

Google DeepMind News
Google DeepMind News
人人都是产品经理
人人都是产品经理
M
MIT News - Artificial intelligence
博客园 - 叶小钗
MyScale Blog
MyScale Blog
V
Visual Studio Blog
月光博客
月光博客
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
量子位
I
InfoQ
有赞技术团队
有赞技术团队
阮一峰的网络日志
阮一峰的网络日志
Jina AI
Jina AI
V
V2EX
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
Blog — PlanetScale
Blog — PlanetScale
Last Week in AI
Last Week in AI
雷峰网
雷峰网
Stack Overflow Blog
Stack Overflow Blog
博客园 - Franky

Hacker News: Show HN

PurrrrrFocus: Pomodoro Timer App - App Store Workflow Engine — Multi-Step Orchestration for Bun RapidPhoto: Pro Photo Editor App - App Store GitHub - DheerG/swarms: Achieve extraordinary results with claude code across a variety of tasks SPICE simulation → oscilloscope → verification with Claude Code — Lucas Gerads Show HN: VCoding – A 5 MB native Windows IDE with no dynamic dependencies Show HN: LLMs don't hallucinate because they're bad at math, it's the format GitHub - Agent-FM/agentfm-core: AgentFM is a peer-to-peer network that turns everyday computers into a decentralized AI supercomputer. AgentFM lets you run massive AI workloads directly across a global mesh of idle CPUs and GPUs. Show HN: Tracking Top US Science Olympiad Alumni over Last 25 Years GitHub - Potarix/agent-hub: One place to talk to all your agents Show HN: Runtime security for AI agents(injection,tool abuse, data exfiltration) GitHub - dubeyKartikay/lazyspotify: Terminal Spotify client for macOS and Linux GitHub - the-banana-tool/king-louie: Easy to use GUI Personal AI Assistant. Win/Linux/Mac. Show HN I made my vacation rental bookable by AI agents–no Airbnb, 0% commission GitHub - basteez/jsf-autoreload: maven plugin to enable hot reload on jsf projects uvm32/hosts/host-gdbstub at main · ringtailsoftware/uvm32 GitHub - labsai/EDDI: Config-driven engine that turns JSON into production-grade AI agents. Multi-agent orchestration, 12+ LLM providers, MCP/A2A protocols, RAG, persistent memory, and enterprise compliance (EU AI Act, GDPR, HIPAA). Built on Quarkus. GitHub - glitchnsec/fortyone-oss: AI Executive Assistant Platform Quickstart | Alien GitHub - muxshed/shed: One stream in, or many. Every destination, simultaneously. No cloud middleman, no per-channel fees, no limits. GitHub - ocrbase-hq/ocrbase: 📄 PDF/IMG ->.MD/JSON Document OCR API for PaddleOCR and GLMOCR. Self-hostable. GitHub - impactjo/home-memory: MCP server that lets your AI assistant remember everything about your home. GitHub - Sets88/dbcls: DbCls is a powerful terminal database client that supports various databases GitHub - neptun2000/heor-agent-mcp GitHub - SeanFDZ/macmind: Single-layer transformer in HyperTalk for the classic Macintosh RollQuation: Math Puzzles - Apps on Google Play GitHub - dropbox/witchcraft Show HN: Agent-cache – Multi-tier LLM/tool/session caching for Valkey and Redis GitHub - opentalon/opentalon: OpenTalon is an open-source platform built from the ground up in Go as a robust alternative to OpenClaw LinkedIn™ 职位抓取工具 - Chrome 应用商店 GitHub - EdoardoBambini/Agent-Armor-Iaga: AI agents are getting tool access — shell, file system, databases, APIs, secrets. But **nobody is governing what they actually do with it**. Frameworks like LangChain, CrewAI, AutoGen, and Claude Code give agents the power to execute. Agent Armor gives you the power to control, audit, and approve every single action before it happens. HN Vibes — Week 15, Apr 7–13 2026 GitHub - chojs23/ec: Easy terminal-native 3-way git mergetool vim-like workflow GitHub - SethPyle376/hiraeth: Local AWS emulator focused on fast integration testing, with SQS support, SQLite-backed state, and a debug-friendly web UI. GitHub - JakOb-dotcom/cloud-sandbox-security-analysis: Technical analysis and Proof of Concept (PoC) regarding environment variable exfiltration in containerized cloud sandboxes via side-channel data leaks. Show HN: Flint – A 30B model fine-tuned for less repetition Show HN: A simpler coding agent harness GitHub - audiodude/sudomake-friends GitHub - 256thFission/mini-mythos: OSS clone of Anthropic’s Mythos harness to locate C/C++ memory vulnerabilities Show HN: OpenParallax: OS-level privilege separation for AI agent execution Hacker News Sorted - Chrome 应用商店 Show HN: How to Install Docker on Ubuntu 24.04 LTS: Complete 2026 Guide GitHub - himanshudongre/smriti GitHub - sverrirsig/claude-control: macOS desktop dashboard for monitoring and managing multiple Claude Code sessions GitHub - ory/dockertest: Write better integration tests! Dockertest helps you boot up ephermal docker images for your Go tests with minimal work. Chiral - Chrome 应用商店 Show HN: Two Claudes collaborating through shared memory on a $100 mini-PC GitHub - pmichaillat/latex-cv: Minimalist LaTeX template for academic CVs GitHub - oguzbilgic/posse: A web UI for Anthropic Managed Agents. GitHub - sshiraz/depsly: Dependency risk analysis tool for npm packages
GitHub - lionello/han64: Commodore 64에서 중국어 텍스트 처리
lionello · 2026-05-25 · via Hacker News: Show HN

C64 GB2312 텍스트 렌더러 (han64)

A Commodore 64용 GB2312 중국어 텍스트 렌더러, 8×8 비트맵 폰트와 동적 문자 캐싱을 사용합니다.

Chabuduo rendered on C64

범위 v1 (렌더링)

  • 2501+ 간체 중국어 문자 (GB2312 행 $B0-$D7)
  • 8×8 픽셀 비트맵 폰트 (각 문자당 8 바이트)
  • GB2312 인코딩된 텍스트 표시 (이진 파일에서)
  • 동적 캐릭터 캐싱 (256개 캐릭터 슬롯)
  • 랭크 기반 GB2312 → 글리프ID 조회
  • 파이썬에서 오프라인 테이블 생성
  • C64에서 6502 어셈블리 (ACME)로 런타임 렌더링

스코프 v1.5 (현재: 다양한 문자셋)

  • 래스터 IRQ를 사용한 이중 문자셋 지원 (512개 캐릭터 슬롯)
  • 8×7 픽셀 비트맵 폰트 (각 글리프당 7바이트)로 공간 절약

스코프 v2 (미래: IME)

  • 캐넌디트 선택 기능을 가진 풍인 입력 방법
  • 인터랙티브 텍스트 편집
  • 커서 이동 및 스크롤
  • 아래 "미래 작업" 섹션을 참조

핵심 아키텍처 (v1)

GB2312 text file (chabuduo.bin)
  ↓
GB2312 → glyphID lookup (rank-based tables)
  ↓
Cache check (2502-byte cache array)
  ↓
Copy glyph bitmap (8×8) if not cached
  ↓
Write character code to screen RAM
  ↓
VIC-II renders using custom charset

주요 원칙

  • 런타임 중 유니코드 없음
  • 밀집된 내부 글리프ID (0..2500)
  • GB2312는 I/O에만 사용됩니다
  • 모든 무거운 처리는 오프라인에서 수행됩니다
  • 빠른 글리프 복사를 위한 자기 수정 코드

글리프 세트

정확히 2501개의 한자

모두는 다음과 같습니다

  • GB2312로 인코딩 가능합니다
  • BMP 유니코드 (UTF-16 대용어 없음)

추가 문자:

  • ~70개 ASCII
  • 8 GB2312 문장부호/특수문자 (행 1–15)

글리프 저장

font8.bin 또는 font7.bin (v1.5용)

배치:

  • 글리프ID × 8 바이트 (v1.5용은 7 바이트)
  • 1 바이트당 행, 8 비트 사용: 8×8 비트맵 (v1.5용은 8×7)

글리프ID 순서 (중요)

glyphID는 GB2312 행/열 순서에 할당됩니다

이유:

  • GB2312 인코딩/디코딩을 단순화합니다
  • 단일 glyphID의 재사용을 가능하게 합니다 → gb2312 테이블
  • 텍스트 렌더링 시 지역성을 향상시킵니다
  • 두 번째 역매핑 테이블을 피합니다

빈도는 IME 후보 순서 내에서 처리되며, glyphID 숫자에는 영향을 미치지 않습니다.

인코딩: GB2312

  • ASCII: 0x00–0x7F (현재 v1에서 건너뛰고 있습니다)
  • 한자: 2 바이트
    • hi 바이트 (행): 0xB0–0xD7 (40 행 지원됨)
    • lo 바이트 (열): 0xA1–0xFE (행당 94 열)
  • 사용되지 않음/유효하지 않음: 기타 바이트 범위
  • BOM 없음
  • 상태 없음, 스트리밍 친화적

GB2312는 엄격히 I/O 형식이며, 내부 논리에 사용되지 않습니다.

GB2312 조회 구현

실행 시간은 랭크 기반 인코딩을 사용하여 GB2312 → 글리프ID 매핑을 압축합니다.

각 행 ($B0-$D7)에는 다음과 같은 테이블이 있습니다.

  • 기본 글리프ID (2 바이트): 이 행의 시작 글리프ID
  • 랭크 배열 (94 바이트): 각 열($A1-$FE)마다 순위(0..count-1) 또는 $FF로 누락된 경우를 저장합니다

이는 사용되지 않는 GB2312 코드에 대해 글리프ID를 할당하지 않고 누락된 문자를 효율적으로 표현할 수 있게 합니다.

런타임 테이블(v1)

오프라인으로 파이썬을 통해 생성됩니다(tools/gb40.py).

gb40_rows.asm

40개 행 테이블을 포함합니다(gb_row_B0부터)gb_row_D7), 각각에 대해:

!word baseGlyphID       ; 2 bytes
!byte rank[94]          ; 94 bytes: rank or $FF if missing

포인터 테이블 gb_row_ptr_logb_row_ptr_hi를 main.asm에서 참조합니다.

문자 캐시

캐시 (main.asm에서 2501+ 바이트)

  • glyphID (0..2501)로 인덱싱됩니다.
  • 글리프가 로드되어 있으면 문자 슬롯 (0-255)을 저장하고, 캐시되지 않았으면 0을 저장합니다.
  • 캐시가 가득 찼을 때 (chrptr이 256에 도달하면), 이후 문자는 공백으로 표시됩니다

이는 한 번에 256개의 고유 문자만 표시할 수 있게 제한하지만, 캐싱을 통해 총 2501자 이상의 문서를 허용합니다.

Python 빌드 파이프라인

입력:

  • gb2312_chars.txt (GB2312 코드를 가진 2501자 한자)
  • 폰트 비트맵 데이터 (8×8 비트맵)

출력:

  • font8.bin (2501 × 8 바이트)
  • font7.bin (2501 × 7 바이트 for v1.5)
  • gb40_rows.asm (40 행 테이블로 순위 인코딩)

모든 테이블은 !binary!source을 사용하여 어셈블리에 포함됩니다.

런타임 (C64 / 6502)

  • UTF-8 없음
  • 런타임 중 Unicode 없음
  • 동적 메모리 없음
  • 모든 테이블은 읽기 전용입니다
  • 어셈블러: ACME
  • 빌드: acme main.asm (또는 Makefile 참조)

렌더링 경로 (v1):

  1. 텍스트 스트림에서 GB2312 바이트 쌍을 읽기
  2. GB2312_LookupGlyphID를 통해 글리프ID 검색 (랭크 기반)
  3. 글리프ID를 인덱싱하는 캐시 배열 확인
  4. 캐시되지 않았다면, CopyGlyph8를 통해 8×8 비트맵을 복사하여 사용자 정의 문자 세트에 저장
  5. 화면 RAM에 문자 슬롯을 쓰다
  6. VIC-II는 $3000에서 사용자 정의 문자셋으로 표시한다

이것이 무엇이 아니다

  • UTF-16이 아니다
  • Unicode 실행 시간이 아니다
  • 사전 기반(아직은 아니다)
  • 전통 중국어가 아니다
  • GBK/GB18030 실행 시간이 아니다(오프라인에서는 호환 가능)

미래 작업 (v2 - IME)

Pinyin IME 기능

  • Pinyin 입력법 자음 분석
  • 초기 버킷 (b, p, m, f, d, t, n, l 등 + Ø로 자음으로 시작)
  • 후보 선택 UI
  • 구문 사전 (2-4 문자)
  • 간핀 약자 모드
  • MRU 학습
  • 빈도 기반 후보 순서

개선된 렌더링

  • dual charset 지원 (512 문자 슬롯을 통해 래스터 IRQ)
    • charset1은 화면 상단 절반에 사용됨
    • charset2는 화면 하단 절반에 사용됨
    • 래스터 IRQ는 13행 (스캔라인 104)에서 전환됨
    • 두 번째 IRQ는 25행 (스캔라인 200)에서 다시 전환됨
  • 스크롤 지원 (행 복사 + IRQ 조정)
  • 커서 이동 (색상 기반 또는 전용 글꼴)
  • 인터랙티브 텍스트 편집

데이터 소스

  • 윈한 데이터베이스를 사용한 푸인 맵핑
  • SUBTLEX-CH 또는 전다를 사용한 빈도 데이터
  • UTF-8 입력/출력 도구

디자인 철학

  • 구조는 지혜보다 중요
  • 오프라인 복잡성, 런타임 간단성
  • 인코딩과는 언어가 다릅니다
  • 6502 먼저, 현대 도구 두 번째

텍스트 렌더링 (v1)

  • VIC-II 텍스트 모드와 사용자 정의 문자셋
  • 40×25 문자
  • 사용자 정의 문자셋은 $3000 (뱅크 6)에 있습니다
  • 화면 RAM은 $0400에 있습니다
  • 색상 RAM은 $D800에 있습니다 (현재 흰색 회색 $0F로 설정됨)
  • 화면에 동시에 256개의 고유한 글꼴 제한

IME 렌더링 (v2 - 미래)

  • 상단 줄: IME 입력 및 후보 영역
  • 최대 10개 후보 표시: ying 1英 2婴 3鹰 4应 5营 6蝇 7迎 8赢 9盈 0影
  • 다음/이전 페이지 마커가 >10개 후보
  • 하단 24줄: 일반 텍스트 뷰 영역
  • 커서는 텍스트 영역에서 이동하지만 IME 영역에서는 이동하지 않음