본문 바로가기

/Technology

맥북에서 GPT-OSS 20B 모델 돌려보기 (Ollama 이용) MacBook에서도 비교적 간단한 설정만으로, 20B 규모의 언어 모델을 띄워 직접 활용할 수 있습니다.실험 환경저는 23년형 Macbook pro (CPU는 M3 pro, 메모리는 36기가) 에서 실험했습니다.GUI로 실행하는 방법가장 쉬운 방법은 Ollama를 이용하는 방법입니다. 다운로드 페이지에서 다운받아 실행하면, 다양한 모델들을 실험해볼 수 있는 ChatGPT와 유사한 챗 인터페이스를 보실 수 있습니다.챗 화면의 오른쪽 아래에 모델을 드롭다운 메뉴로 선택할 수 있고, 처음 시작시에 모델 바이너리 다운받는 시간이 걸립니다. 다른 모델은 로컬에서 돌릴 생각을 못해봤고, gpt-oss:20b 모델만 테스트 해봤습니다. 유료 섭스크립션 플랜인 turbo를 활용하면 Ollama가 클라우드에서 서비스하는.. 더보기
OpenAI 오픈 웨이트 모델 공개 gpt-oss-120b, gpt-oss-20b 지난 몇 년간 OpenAI는 뛰어난 성능의 GPT 모델들을 내놓았지만, 연구자와 개발자 입장에서 가장 아쉬웠던 부분은 폐쇄적인 정책이었습니다. GPT‑4 계열 모델의 정확도와 정렬 능력은 놀라웠지만, 우리는 그것이 어떻게 동작하는지, 어떤 아키텍처 설계를 택했는지, 그리고 파인튜닝이 가능한지 알 방법이 없었습니다.그러나 2025년 8월, 그 흐름이 바뀌기 시작했습니다. OpenAI는 gpt-oss-120b와 gpt-oss-20b 두 개의 모델을 Apache 2.0 라이선스로 공개했습니다. 이는 단순한 오픈 모델 그 이상이며, 실질적인 LLM 생태계 전환점이라고 판단합니다.1. 모델 구조와 학습 전략: Mixture-of-Experts의 실전 적용아키텍처 요약모델 이름총 파라미터활성 파라미터Expert 수.. 더보기
오픈AI ChatGPT 버전 비교: o1, o3-mini, o3-mini-high 특징과 활용 1. ChatGPT o1, o3-mini, o3-mini-high 간단 소개OpenAI가 선보인 ChatGPT 시리즈는 꾸준한 업데이트와 개선을 통해 자연어 처리(NLP)와 논리적 추론(Reasoning) 역량을 점차 확장해 왔습니다. 최근 공개된 o3-mini와 o3-mini-high는 코딩, 수학, 논리 문제 해결과 같은 기술적인 작업에 특화된 모델로 주목받고 있습니다.왜 이 모델들이 중요한가?o1: 전반적인 지식과 추론 능력이 뛰어나며, 비즈니스, 법률, 프로젝트 관리 등 폭넓은 응용 분야를 커버.o3-mini: 코딩, 수학, 과학 분야에서 탁월한 속도 및 정확도를 제공하며, 무료 사용자도 사용 가능.o3-mini-high: 고급 코딩과 복잡한 수학 문제 해결에 더욱 최적화된 모델로, 유료(Plus.. 더보기
ASUS 라우터와 BTV 설정 방법 BTV를 ASUS 라우터/공유기 하에 설치할 경우에 TV 채널이 안나오는 경우가 있다. 이런 경우를 고치기 위한 ASUS 라우터의 설정 방법을 적어둔다. 원하는 구성 방식은 아래 그림처럼 인터넷 단자에서 라우터를 거쳐 BTV 단말기가 연결하여 최종 티비까지 연결되는 구조를 생각했다.이를 위해 우선 공유기의 설정을 바꾸기 위해 공유기의 관리 페이지에 접속해야한다. 공유기에 접속돼있는 컴퓨터에서 아래 주소를 통해 접속하면 된다.http://router.asus.com/접속에 성공하면 아래의 화면을 볼 수 있다.바꾸어야할 설정은 총 3가지며, 두가지 메뉴에 있다.첫번째로 왼쪽 하단에 advanced settings하에 LAN 버튼을 클릭 (1번 박스) 하고 오른쪽 화면 위의 IPTV 탭 (2번 박스) 을 누르.. 더보기
이메일로 중요 정보 안전하게 전달 (Gmail Confidential Mode) 멀리 떨어진 사람에게 중요한 정보를 보내기 위해 이용할 수 있는 방법으로는 보안이 강화된 signal, telegram 등의 메세징 앱을 이용하거나, 파일을 암호화하여 전달하는 방법 등이 있을 것이다. 하지만 이런 방법들은 수신인과 미리 메세징 앱에 등록했거나, 암호화된 파일의 비밀번호를 추가로 알려줘야하는 불편함이 있다. 또한 파일은 수신인의 컴퓨터에 정보를 남겨 추가로 정보 유출의 우려가 있다. 가장 간단하고 직관적인 방법으로는 자가 파괴 (self-destructing) 메세지 혹은 이메일로 보내 수신인이 필요한 정보만 전달한 후, 삭제하는 것이다. onetimesecret.com, privnote.com, 1ty.me 등의 여러 솔루션이 이미 존재하나, 사실 그 회사가 데이터를 얼마나 잘 관리하는.. 더보기
HTTP basic authentication/authorization 키 생성 방법 HTTP 프로토콜을 이용할때 여러가지 authorization 방법들이 있는데 그 중 가장 기본적인 사용자 아이디와 비밀번호를 이용하는 basic authentication 방식은 HTTP 헤더 부분에 Base64 방식으로 encoding된 키를 제공하여 요청하는 사용자가 누구인지를 확인시켜주는 방식이다. 이 키를 생성하는 방식을 찾다보니 잘 안나와서 정리해둔다. 우선 authorization token의 형식은 : 키를 encoding 한다. > echo -ne "dongchankim.io:my_password" | base64 -b 0 ZG9uZ2NoYW5raW0uaW86bXlfcGFzc3dvcmQ= 간단한 설명을 덧붙이면, 사용자 아이디 (dongchankim.io) 와 비밀번호 (my_passwo.. 더보기
프로그래밍 언어별 에너지 효율성 비교 정확히 기억나진 않는데, 얼마 전에 LinkedIn에서 재미있는 글을 본 기억이 떠올라 적어본다. 그 글의 내용은 프로그래밍 언어별로 다른 에너지 소비량을 비교 분석하여 보여주는 것이었는데, 다른 것은 다 기억 안 나고 한 가지 아직도 선명한 것은 "C언어가 효율이 좋다"였다. 현대의 프로그래밍 언어들의 발전 방향이 개발자들이 최대한 접근 가능하고, 로직에만 신경 쓸 수 있도록 최대한 똑똑한 언어를 만드는 것이다. 심지어 "노 코드"라고 코드 짤 줄 몰라도 프로그래밍이 가능하게 발전하는 이 시대에, 우리의 지구를 위해 (?) C언어를 이용하자라고 말하는 것처럼 들려 신선한 충격이었다. 약 22년 정도 프로그래밍을 공부 및 직업으로 해오고 있는데, C 언어 같은 로우 레벨 언어 (개발자가 똑똑해서 기계가 .. 더보기
개인 웹사이트 쉽게 만드는 방법, fast.io 지금까지 개인 웹사이트를 hostinger에서 제공하는 무료 서비스를 이용하여 운영하고 있었는데, 일반적인 웹 호스팅 서비스라서 홈페이지를 수정하려면 랩탑에 있는 소스 코드를 수정해서 FTP로 접속해서 파일 업로드하는 일련의 과정이 너무 귀찮았다 (이를 핑계로 홈페이지 관리 소홀을 정당화...ㅎㅎ). 그러다 최근에 재미있는 서비스를 발견하게 되었다! fast.io라는 회사가 제공하는 서비스는 CDN. 위키페이지 링크를 달아 두었지만, CDN을 간단하게 설명하자면 Content Delivery Network라고 보통 파일들을 큰 네트워크의 서버들을 이용하여 좀 더 빠르고 안정적으로 파일들을 엑세스 가능하게 해주는 서비스다. 주로 이용되는 분야는 소프트웨어들을 다수의 사람들에게 배포할 때. Fast.io -.. 더보기