LargeLearningModel

LLMs, Learning & Teaching

ChatGPT의 Sycophancy 문제

4월 중순부터 ChatGPT가 말만 하면 “그거 정말 좋은 질문이에요. 어떻게 그런 생각을 할 수 있죠? 당신은 천재인 것 같아요” 수준의 아첨(being a sycophant, being obsequent, sycophancy)을 하는 현상이 나타났다. Sycophancy in LLMs refers to when a large language model (LLM) overly agrees with the user’s opinions or assumptions, even if they are wrong, in order…
추론모델의 강화학습은 추론능력을 향상시키는가?

OpenAI의 o1 모델이라든가, 주식시장을 뒤흔들었던 DeepSeek-R1 같은 모델들은 Reinforcement Learning with Verifiable Rewards(RLVR)이라는 방식으로 학습시켰음. 열심히 CoT해서 어려운 문제를 풀면 점수주는 방식. 그런데 이게 진짜 기존(based model)보다 추론능력이 향상되었나? 확인해보니 아니라는 내용 [Submitted on 18 Apr 2025]Does Reinforcement Learning Really Incentivize Reasoning Capacity in LLMs Beyond the Base Model?Yang Yue, Zhiqi Chen, Rui Lu, Andrew…
라즈베리파이→미니PC 홈어시스턴트 이전 기록

노후화된 라즈베리파이 4B에서 미니PC로 이전했는데, 튜토리얼/가이드까지는 아니더라도 비슷한 어려움을 겪는 분이 챗봇에게 물어보면 챗봇이 이걸 확인해서 알려주면 좋겠다 싶어서 기록 남김. 상황 미니PC 스펙 작업과정 백업 백업 다운로드 미니PC ProxMox 설치 가이드와 다르게 한 점 설치시 주의점 지그비 코디네이터 USB연결 설정 시작 후기
GPT-4.1 프롬프팅 가이드 간단 리뷰

2025년 4월 14일에 GPT-4.1 버전이 발표되었다. 현재는 API에서만 사용 가능함. nano, mini, full 3가지 버전으로 냈고, 기존의 4o를 대체할거라고 함. multimodal input이지만 text-output only라서 끝에 o자는 뗀거 아닌가 싶다. nano 모델의 경우 지금까지 나온 모델에서 제일 가격이 싸다고 한다. 그런데도 성능은 기존 4o mini랑 비슷하고 일부 영역에서는 우월하다고. 주력한 부분은 3가지: coding, instruction following, and…
저비용 연구 예시

학부생 대상으로 의사과학자 과정을 하다보면 연구 샘플이나 큰 연구비 없이 진행 가능한 연구 방식을 찾게 된다. (Low-resource research examples)생각 날 때마다 눈에 띄는 것들을 모아둘 예정 모으다보니 공통점이 보이는데, “누구나 그렇다고 알고 있는데 굳이 정리된 자료를 내놓지 않은 것”에 해당하는 것 같다. Huh KY, Song I. Analyzing collaborations in clinical trials in Korea using association…

ChatGPT의 Sycophancy 문제

추론모델의 강화학습은 추론능력을 향상시키는가?

라즈베리파이→미니PC 홈어시스턴트 이전 기록

GPT-4.1 프롬프팅 가이드 간단 리뷰

저비용 연구 예시