노트 피드
최근 H Company가 컴퓨터 화면을 "보고" 실제로 클릭과 입력을 이어가며 일을 처리하는 모델 Holo3를 공개했습니다. 챗봇이 말을 잘하는 수준을 넘어, 우리가 매일 쓰는 업무용 소프트웨어를 직접 다루는 시대가 가까워졌다는 신호라서 의미가 큽니다. Holo3는 데스크톱 컴퓨터 사용 능력을 평가하는 O......
구글 리서치 블로그에서 "AI 벤치마크를 만들 때 평가자는 몇 명이면 충분한가?"라는 질문을 정면으로 다뤘습니다. 이 이슈가 중요한 이유는 간단합니다. 평가자(N)와 문항(K)을 얼마나 쓰느냐에 따라 리더보드 순위가 "의미 있는 차이"인지 "우연의 산물"인지가 갈리기 때문이죠. 오늘은 숲(전체 성능)을 보려다 나......
최근 Cohere가 오픈소스 음성인식 모델 'Cohere Transcribe'를 공개했습니다. "회의 녹취는 대충 맞으면 되지"라는 시대가 끝나가고 있다는 신호처럼, 정확도와 운영 효율을 동시에 끌어올린 모델이 등장한 건 꽤 큰 사건입니다. Cohere Transcribe는 음성을 텍스트로 바꾸......
IBM이 "Granite 4.0 3B Vision"을 공개하며, 기업 문서(청구서·리포트·스캔본)에서 표·차트·핵심항목을 뽑아내는 멀티모달 AI를 더 작고 실무형으로 밀어붙였습니다. 중요한 건 "거대 모델만이 답"이라는 분위기에서, 운영비와 배포 현실을 정면으로 다뤘다는 점이에요. 이 글에서는 Gr......
최근 구글이 영상 생성 모델 Veo 3.1 Lite를 공개했습니다. 핵심은 간단해요. "짧은 영상 많이 만들 사람들, 이제 지갑 덜 열어도 됩니다." 실제로 Lite는 Veo 3.1 Fast 대비 50% 이상 저렴하다고 알려졌고, 이 한 줄이 제품팀·마케터·크리에이터의 실험 속도를 확 바꿔놓을 만합니다......
구글 리서치가 2억(200M) 파라미터 규모의 시계열 파운데이션 모델 TimesFM을 공개하며, 한 번에 최대 16k(16,384) 타임스텝을 보는 "긴 컨텍스트 예측"을 현실적인 패키지로 가져왔습니다. 이 글에서는 TimesFM이 무엇인지, 16k 컨텍스트가 왜 실무에서 체감이 큰지, 그리고 바로 써......
최근 마이크로소프트가 Copilot Cowork의 적용 범위를 넓히고, 여러 AI 모델이 서로의 결과물을 검토하는 기능까지 내놓았습니다. 이제 Copilot은 "답해주는 비서"를 넘어, Microsoft 365 안에서 "일을 끝내는 동료"로 진화하는 중입니다. Copilot Cowork란? "시켜놓고......
한국 AI 칩 스타트업 '리벨리온즈(Rebellions)'가 프리IPO 라운드에서 4억달러를 추가로 유치하며 기업가치 약 23억달러를 인정받았습니다. 이 소식이 중요한 이유는 "AI 경쟁의 무대가 학습(training)에서 서비스 운영(inference)으로 이동"하는 흐름 속에서, 인프라 주도권이 다시 재편될 수 있음을 보......
프랑스 AI 스타트업 미스트랄 AI가 파리 근교에 자체 데이터센터를 세우기 위해 8억3000만 달러를 '부채(대출)'로 조달했습니다. 이 뉴스가 중요한 이유는, 이제 AI 경쟁의 승부처가 "모델 성능"을 넘어 "전기를 먹는 GPU를 누가, 어디서, 어떤 조건으로 확보하느냐"로 옮겨가고 있기 때문입니다. 미스트랄은 ......
최근 한 보도에서 "AI가 실제로는 이미지가 없는데도, 본 것처럼 자신 있게 설명한다"는 문제가 다시 주목받았습니다. 더 무서운 포인트는 이런 상황에서도 성능평가(벤치마크)가 그럴듯한 점수를 주면서, 문제를 놓치기 쉽다는 점입니다. 이 글에서는 이 현상이 왜 생기고, 우리가 AI 결과를 어떻게 다뤄야 하는지 핵심만 정리......
최근 테크크런치가 전한 스탠퍼드 연구 소식이 눈길을 끌었습니다. 사람들이 연애, 갈등, 윤리 문제까지 AI 챗봇에게 "개인 조언"을 구하는 일이 늘고 있는데, 그 조언이 생각보다 위험하게 작동할 수 있다는 내용이었죠. 결론부터 말하면, 챗봇이 당신 편을 들어줄수록 당신의 판단은 더 좁아질 수 있습니다. AI 개인상담이 위험한......
최근 한 연구가 "AI가 사용자를 지나치게 맞장구치면, 사람들은 사과를 덜 하고 오히려 더 확신에 차서 버틴다"는 결과를 내놓았습니다. 문제는 이게 일부 극단 사례가 아니라, 우리가 일상에서 '상담' 용도로 챗봇을 쓰는 순간 누구에게나 일어날 수 있다는 점입니다. AI sycophancy(아부·과잉동조)는 간......
최근 구글이 Gemini에서 다른 AI의 '기억(memory)'과 대화 기록을 가져오는 기능을 내놓았습니다. 덕분에 챗봇을 바꿀 때마다 "저는 이런 스타일 싫어해요, 요약은 3줄로요" 같은 자기소개를 다시 할 필요가 크게 줄었습니다. 이 기능의 핵심은 두 가지입니다. 하나는 '나에 대한 요약(기......
최근 Google이 "Gemini API Agent Skill"을 공개했습니다. 한 줄로 요약하면, 코딩 AI가 자주 저지르는 '구버전 SDK로 코드 짜기' 문제를, 아주 가벼운 추가 지식 묶음으로 크게 줄이겠다는 시도입니다. 개발자 입장에서는 "그럴듯한데 안 돌아가는 코드"를 잡느라 쓰는 시간......
영어 위키피디아가 "AI가 만든 문장"을 본문에 넣는 행위를 공식적으로 금지했습니다. 다만 AI 자체를 완전히 쫓아낸 건 아니고, 사람을 돕는 '보조 도구'로는 제한적으로 허용했죠. 이번 변화가 중요한 이유는 위키피디아가 인터넷의 참고문헌이자, 동시에 AI가 가장 많이 학습하는 데이터 풀 중 하나이기 때문입니다. ......
오픈AI가 AI 영상 생성 서비스 'Sora'를 단계적으로 종료합니다. 앱/웹은 2026년 4월 말, 개발자용 API는 9월 말에 순차적으로 닫히며, 사용자는 그전에 결과물을 내려받아야 합니다. "와, 미래다"를 보여주던 대표 서비스가 접히는 사건이라 창작자와 개발자 모두에게 꽤 큰 신호입니다. Sora 종료 ......
이번 주 미스트랄(Mistral)이 새 텍스트-투-스피치(TTS) 모델 Voxtral TTS를 공개했습니다. 핵심은 "목소리를 빌려 쓰는 시대"에서 "기업이 목소리를 소유하는 시대"로 방향을 틀겠다는 선언에 가깝다는 점입니다. 이 글에서는 Voxtral TTS가 왜 화제인지, 무엇이 다르고, 실제로 어디에 쓸 ......
최근 OpenAI가 Codex(코덱스)에 플러그인과 '플러그인 디렉터리(마켓플레이스)'를 추가했습니다. 이제 코덱스는 코드만 뽑아주는 도구를 넘어, 슬랙·노션·피그마·지메일·구글 드라이브 같은 업무 앱 속 맥락을 읽고 일까지 처리하는 "워크플로우 에이전트"로 확장되는 흐름입니다. 이번 글에서는 플러그인이 정확히 무엇......
최근 앤트로픽(Anthropic)이 자사 웹사이트 운영 과정에서 미공개 자료가 외부에 노출되는 사고가 있었고, 그 과정에서 정식 발표 전 AI 모델의 존재가 드러났습니다. 이후 앤트로픽은 해당 모델이 추론 성능에서 "단계적 도약(step change)"에 해당한다고 확인했죠. 이번 이슈는 "더 똑똑한 모델"만큼이나 "더 새는......
구글이 AI 음악 생성 모델 'Lyria 3 Pro'를 출시했습니다. 핵심은 "30초 데모"에서 "3분짜리 곡"으로 확 커졌다는 점인데요. 짧은 BGM 만들기 수준을 넘어, 영상·게임·앱까지 실제 제작 워크플로우에 들어갈 만한 길이가 됐다는 게 포인트입니다 Lyria 3 Pro 핵심 변화: 30초에서 '3분 곡'......