| 1. |
Building a safe, effective sandbox to enable Codex on Windows
Windows에서 Codex를 안전하게 돌리기 위한 샌드박스 설계 핵심 공개
|
| 2. |
github/spec-kit
GitHub가 명세부터 구현까지 잇는 스펙 주도 개발 CLI 툴킷을 공개
|
| 3. |
Anthropic, Claude에게 "왜"를 가르치다 - 정렬 훈련(Alignment Training) 개선 사례
Claude에 규칙 대신 이유를 학습시켜 정렬 품질을 높인 최신 훈련 사례
|
| # | 소스 | 주제 | 제목 | 한줄 요약 |
|---|---|---|---|---|
| 1 | GitHub | CodingAgentOpenSource | github/spec-kit | GitHub의 스펙 주도 개발 툴킷, 명세에서 구현까지 CLI로 연결 |
| 2 | PyTorch KR | AgentLLMProductivity | Cheat on Content: 자기 진화형 콘텐츠 평가 루브릭을 갖춘 Claude Code 스킬 기반 운영 에이전트 어제 | Claude Code 스킬과 자기 진화형 루브릭을 결합한 콘텐츠 운영 에이전트 |
| 3 | GeekNews | LLMAlignmentResearch | Anthropic, Claude에게 "왜"를 가르치다 - 정렬 훈련(Alignment Training) 개선 사례 어제 | Claude에 행동 규칙이 아닌 이유를 학습시키는 정렬 훈련 개선 사례 |
| 4 | HF Papers | AgentResearchTooling | MCP-Cosmos: World Model-Augmented Agents for Complex Task Execution i… | 월드 모델 결합으로 MCP 환경의 복합 작업 수행력을 높인 에이전트 프레임워크 |
| 5 | HF Papers | AgentMultimodalResearch | Towards On-Policy Data Evolution for Visual-Native Multimodal Deep Se… | 시각 네이티브 멀티모달 딥서치 에이전트용 온폴리시 데이터 진화 방법 제안 |
| 6 | HF Papers | MultimodalReasoningResearch | SeePhys Pro: Diagnosing Modality Transfer and Blind-Training Effects … | 멀티모달 RLVR의 물리 추론 한계와 블라인드 학습 효과 진단 연구 |
| 7 | AI Lab Blogs | AgentSecurityInfra | Building a safe, effective sandbox to enable Codex on Windows 어제 | Windows용 Codex 실행을 위한 안전·격리 샌드박스 설계와 제어 방식 |
| 8 | Simon Willison's Weblog | LLMToolingInference | llm 0.32a2 어제 | llm 0.32a2, OpenAI responses 엔드포인트 전환 대응 알파 릴리스 |
| 9 | r/LocalLLaMA (Top Today) | LLMInferenceResearch | I got a real transformer language model running locally on a stock Ga… 어제 | 게임보이 컬러에서 TinyStories-260K 트랜스포머 로컬 구동 구현 |
| 10 | Hacker News Front Page | LLMInfraResearch | The US is winning the AI race where it matters most: commercialization 어제 | 미국 AI 우위의 핵심을 모델 성능보다 상용화·클라우드·데이터로 짚은 분석 |
Python · 1,159 stars today · ⭐ 98,268