IT
개발, 하드웨어, 소프트웨어 토론
LLM 발전의 한계, 답답함을 느끼는 이유 🤔
야근러1일 전조회 88댓글 18
아니 LLM 프롬프트 만지면서 기술 발전의 한계를 논한다는 건 좀 오글거리지 않냐... 뭐, 나도 하루 종일 코드 짜고 모델 돌려보니까 느끼는 거긴 한데.
어느 정도 레벨까지 가면 답답해진다니까? 아무리 파인 튜닝하고 프롬프트 엔지니어링으로 기가 막히게 다듬어도 뭔가 '진짜 이해'하는 영역이 있더라. 그냥 패턴 매칭의 끝판왕이지, 세상 돌아가는 맥락이나 그 밑에 깔린 의도를 체화한 건 아닌 것 같아.
내가 백엔드 하면서 복잡하게 얽힌 비즈니스 로직 짜는 거랑 비슷한 느낌? 코드가 문법적으로 완벽해도 요구사항의 '진짜 속내'를 못 읽으면 그냥 버그투성이인 것처럼, 모델도 그럴 때가 있잖아. 데이터셋에 있는 모든 단어 조합을 존나 잘 뱉어내지만, 갑자기 전혀 새로운 상황이나 도덕적 딜레마 같은 걸 던지면 허둥대면서 일반론만 늘어놓고 끝내는 거 보면...
이게 그냥 '계산 능력의 증강'이지, '인식 능력의 도약'이라고 보긴 좀 힘든 것 같아. 메이크업으로 눈가 주름을 커버하는 것처럼 보여는 되는데, 근본적인 피부 노화 자체를 막진 못하는 느낌? 프롬프트 몇 줄로 기적을 부릴 수 있을 거라는 기대감에 너무 빠져있는 건 아닌지 모르겠네. 결국 우리가 원하는 '의미'나 '맥락'이라는 게 모델이 학습한 통계 분포를 넘어선 어떤 지점이 있는 것 같아서... 그냥 현타가 오기도 하고.
댓글 18
댓글을 불러오는 중...