2026/03 17

MountainCar - Double DQN, Gradient Clipping, 하이퍼파라미터 다루기

나는 이전에 -120대에서 MountainCar 구현을 마무리 지었지만, 공식 문서에서는 100개 이상의 trials에서 -110 이상의 Reward를 문제 해결의 기준으로 판단한다. MountainCar v0A toolkit for developing and comparing reinforcement learning algorithms. - openai/gymgithub.com 그래서, 이러한 찜찜함을 제거하기 위해, MountainCar 문제에 마저 도전을 수행해보았다.DDQN 적용 Double DQN 최적 행동 선택과 행동 가치 평가(Q값 평가)의 신경망 분리 학습 시의 실시간 모멘텀을 가치 평가와 분리하면, 순간적으로 가치가 높아진 잘못된 행동을 계속 선택하는 현상을 막을 수 ..

[쿠버네티스 튜토리얼] 8. 쿠버네티스 클러스터 구축부터 CNI, Ingress Controller 설정까지 직접 해보기

앞서, k3s로 쿠버네티스에 대한 정보를 대략적으로 이해했다. 'Article - 깊게 탐구하기/kubernetes, k8s 적용기' 카테고리의 글 목록목표: 핀잇 실사용자 1명 이상 달성하기 글은 비정기적으로 7시에 올라옵니다.go-gradually.tistory.com 클러스터 내에 노드 등록각 노드의 적절한 리소스를 할당하는 방식을, "마스터 노드(컨트롤 플레인)"에서 관리쿠버네티스가 어렵다고 하는 가장 큰 이유선점형/비선점형 리소스 할당을 이용해, 직접 관리하는 것이제 k3s 가 자동으로 진행해주던 부분을 직접 해보며, k8s를 좀 더 깊게 써보자.기본 개념 1 - kubeadm, kubectl, kubelet의 구분기본 개념 2 - 목표 상태 설정모든 노드: k8s 설치 준비모든 노드: k8s ..

2026년 3월 1주차 회고

감사가 무너지면 꾸준함이 무너진다.조급해지기 전에, 대안을 찾기전에, 충분히 감사했나?이번 주의 감사회사의 날 향한 믿음에 감사반드시 보답할 것이다.고객 만족/비즈니스 목표 달성 - 두마리 토끼 잡기돈 걱정 없이 일할 수 있음에 감사친구들의 축하에 감사면접 경험에서의 나의 감사함을 지키면서, 함께 성취하기 위한 깨달음을 주심에 감사항상 무언가를 수행하기.현재 수행하고 있는 구체적인 전술이 무엇인지 정리데이터 기반 전술 평가전략이 쌓이면, 실현 가능성에 대한 불안이 쌓인다. 결국은 전술이다.체계적인 상태를 유지하기.큰그림 그리고 핵심 짚기.처음부터 끝까지 차근차근 전개하기.현 시스템에 대한 감사를 유지하기.보상 체계를 깨끗히 유지하기.입장 중심이 아닌 이익 중심으로 사고하기.팩트와 의견 구분하기.윈-윈 전..

사내정치

최근 A사에서 다대다 면접을 진행했다.해당 면접은 A사의 인프라 면접관님과 백엔드 면접관님, J사의 IT기획 면접관님, A사의 HR 면접관님과 함께 다대다 면접이 진행됐다. 그 면접을 진행하면서, 나의 면접 답변에 잘못된 점이 있었는지, 기획 팀 리더셨던 면접관분의 표정이 굉장히 안좋아지셨다.그래서, 면접관님께 넌지시 떠보듯 여쭤봤는데, 정말 따끔한 조언을 들었다. 이 인사이트가 정말 중요하고 귀중하다고 생각했기에, 다음과 같은 회고를 남긴다. 제목에서 나타내듯 토픽은 사내정치 이다.불건강한 사내 정치가 왜 발생하게 되는지, 그리고 이를 피하기 위한, 일하는 마음가짐을 다룬다. 기획 면접관님은 다음과 같은 질문을 던지셨다. 요즘 AI가 발전하는 만큼, 개발자들도 AI와 경쟁하는 상황에 놓여있다.이와 같..

개발자도 반드시 알아야 하는 핵심 비즈니스 데이터/지표

결국 개발자도 직원이기에, 다양한 부서의 사람들과 소통해야 한다.아무래도 가장 자주 소통하게 될 쪽은 기획일텐데, 일의 우선순위가 전사적 목표에 따라 결정되기 때문이다.회사의 입장에서 생각해보면, 전사적 목표 - 고객 만족, 비즈니스 목표 달성이 우선으로 처리되길 원하는 것은 자명하다.특별한 사내 정치가 관여되지 않는 이상, 이렇게 우선순위가 결정될 것이다. 그래서, 기획자와 소통하기 위한 필수 데이터/지표를 정리해보았다.1. 목표·정렬KPI (Key Performance Indicator)의미: 목표 관리용 핵심 지표(보통 1~5개)체크: KPI는 “행동”이 아니라 “결과” 숫자여야 함예: 월 매출 10억, 신규 유료 20,000명, D30 리텐션 18%North Star Metric (NSM)의미: ..

“너 정말, **핵심**을 찔렀어.”

우리 부모님의 경우, 질문을 받아들이기 까다로워 하셨다.논리적인 토론 및 파고드는 질문을 싫어하셨고, 그냥 시키는 대로 따라하길 원하셨다.그래서, 환경에 적응하는 내가 잘나서 잘할 수 있게 된 것이라 생각했다. 이 방식이 무조건 잘못됐다고 생각하지는 않는다.긴급한 문제에선, 일단 어떻게든 해결하고 넘어가는 것이 중요하다. 하지만, 자주 쓰이게 될 중요한 문제에선 결국 “몰두하여 이해하고, 질문하며 자신의 것으로 만드는 능력”이 중요해진다.내가 무언가에 몰두하는 재미를 느끼게 해주신 분들은, 답답함에 쫓겨 던진 나의 질문에 "예리한 질문이다", “핵심을 찔렀다”, “정말 좋은 질문이다” 라고 해주셨다.그 두분은, 나의 질문과, 피드백 흡수에서 내 가능성을 봐주셨다.나는 그렇게 코딩을 시작했다. 이때의 경험..

2026년 2월 4주차 회고

감사가 무너지면 꾸준함이 무너진다.조급해지기 전에, 대안을 찾기전에, 충분히 감사했나?이번 주의 감사면접 기회에 대한 감사나 자신에게 집중할 수 있는 시간이 충분히 주어짐에 대한 감사매일매일 무언가를 만들어갈 수 있음에 감사항상 무언가를 수행하기.현재 수행하고 있는 구체적인 전술이 무엇인지 정리데이터 기반 전술 평가체계적인 상태를 유지하기.큰그림 그리고 핵심 짚기.처음부터 끝까지 차근차근 전개하기.현 시스템에 대한 감사를 유지하기.보상 체계를 깨끗히 유지하기.입장 중심이 아닌 이익 중심으로 사고하기.팩트와 의견 구분하기.윈-윈 전략 생각하기.단정 짓지 말고, 다음에 무엇을 해야 할 지 상상하기.내가 놓치고 있는 부분이 분명히 존재한다는 걸 인정하기.상대방이 어떤 점을 해결해 주는 것을 원하는가?지금 내가..