gen ai ‐ day2 할루시네이션 - soldatj/googleGenerativeAI GitHub Wiki
00:00
할루시네이션은 가짜, 거짓 이라고 생각하는데 같은 의미가 아니다.
르포 기자는 현장에 가서 현장의 사실을 그대로 보고하는 직업임
소설가는 허구를 그럴 듯하게 구성해서 만들어낸 이야기를 글로 쓰는 사람임
다큐멘터리 작가는 있는 사실을 그대로 전달하기보다는 드라마나 영화나 소설처럼 극적으로 구성을 해서 전달력을 훨씬 더 높이는 사람임
AI 서비스 기획자들은 르포 기자를 기대했을것이지만 실상 소설가보다다 개연성없는 허무맹랑한 글을 지어낸다.
이 허무맹랑하지만 문법자체는 정교한 글을 할루시네이션이라고 한다.
05:05
프로그램밍 언어의 발전
기계와의 대화를 할 때 사람의 지력을 들이더라도 사람보다 기계가 알아들을 수 있게 하는 게 훨씬 더 생산성이 좋았음(낮은 수준의 언어, 어셈블리 등)
시대가 오면서 기계는 컴퓨팅 파워는 굉장히 좋아졌기 때문에 오히려 사람이 잘 이해하는 가독성이 높은 언어로 프로그램밍 언어가 발전함(고수준의 언어, 자바, 파이썬 등)
결론적으로는 프로그램밍 언어라는 거는 결국 기계랑 대화를 얼마나 잘할 것인가에 연속이었음
08:10
Gen ai
트랜스포머가 구현된 게 챗 gpt나 구글의 팜 같은 LLM인데 정확하게 일치하지 않지만 간단하게 우리가 추상화시키자면 하나의 자동 완성임
Gen ai는 단어들이 존재하는 데이터 공간에서 나열된 단어중 다음에 나올 가능성에 가장 가까운것=연관성이 높은것을 찾아내서 자동완성을 시켜주는것과 이론적으로 다르지 않음.
컴퓨팅 성능과 모델의 발전은 하나하나의 토큰을 앞으로 더 많은 수를 예측 할 수 있게 하였고 그것이 말을 만들어내는 수준까지 발전한것임.
단순하게 생각하면 auto-complate 자동완성과 같은 개념이 될 수 있는것임.
>>why generative ai != creative ai?
13:15
템퍼먼츠의 정의
템퍼먼츠는 창의성 재료로 프로벌리티가 문제를 얘기하는 것임
템퍼먼츠를 0으로 놔도 칼루시이가 나올 수 있음
할루시네이션을 줄이려면 최면슬이나 역할급 얘기를 해봐야 함
15:06
ln 젠ai의 잡학다식
lln 젠ai가 지구상에 수많은 몇 페타 이상의 데이터를 학습을 했기 때문에 굉장히 잡학다 시기임
lln 젠ai한테 콘텍스트를 주지 않고 그냥 얘기하면 얘가 어느 카테고리를 어느 커피고 얘기할지를 잘 모름
lln 젠ai한테 콘텍스트를 주고 컨텍스트에 맞는 답을 돌려주는 식으로 우리가 유도하는 것을 프롬프트 엔지니어링 또는 프롬프트 디자인이라고 말할 수 있음
19:49
ai의 패러다임 시프팅
ai 관련해서 패러다임이 시프팅을 하고 있음
ai가 수리 영역에서 언어 영역이 됨
소설가가 되게 하려면 프럼프트 디자인과 파인튜닝을 잘 해야 함
22:20
ai의 사투리 공부
ai는 웹상에 있는 모든 데이터를 학습한 애임
ai는 웹상에 있는 모든 데이터를 공부하다 보니 사투리도 많이 공부를 한 것 같음
ai는 제조사의 일방적으로 책임이 있다기보다는 사용자가 사용하는 팀에서 잘 관리를 해야 된다고 생각함
27:57
구글, AI 아이 거버넌스 도입
구글이 준비하고 있는 response몰 ai 아이 거버넌스 내용이나 문서들은 시스템 중에 내용으로 들어갈 것임
구글로 답변하는 구글로들도 하루 시한이 있을 수 있다는 거를 감안을 하고 답변들을 확정으로 받지 말고 그럴 개연성이 높다 정도로 받아들여 달라고 함
링크나 증빙 자료가 있으면 믿어도 되고 들어가서 확인해 볼 수 있음
34:33
참석자 1 02:25 "네 늦게 오신 분들 계셔서 qna는 이거 끝나고 진행할게요.
먼저 이거부터 하고 진행하겠습니다. 오늘 이제 할루시네션 얘기를 할 거고 내용은 기술적인 것보다는 일반인 수준에서 하려고 하고 있고 네 대신에 이거는 구글의 공식 메시지가 아니라 제 견해에서 말씀드리는 거고 오늘 제가 말씀드리는 내용 중에도 할루시네이션이 있을 수 있습니다."
참석자 1 02:51 "우리가 보통 할루시네이션이라고 하면은 가짜라고 생각하는데 같은 말은 아니고요.
그건 진짜냐 진짜라 같은 말도 아니고 가짜도 진짜도 아니고 무엇입니다.
그거를 무엇이 무엇이냐를 이제 살펴보려면 우리 이제 직업을 좀 보면 글을 쓰는 직업이죠.
셋다. 루보 기자. 루보 기자는 현장에 가서 현장의 사실을 그대로 본인의 직원을 섞지 않고 보고하는 게 루보 기자고"
참석자 1 03:20 소설가는 이제 이 에서 사실 그는 허구 허구를 그럴 듯하게 구성해서 만들어낸 그런 이야기를 이제 글로 쓰는 사람이고 다큐멘터리 작가는 여기서 약간 중간인데 하지만 있는 사실을 그대로 전달하기보다는 약간 드라마나 영화나 소설처럼 약간 극적으로 구성을 해서
참석자 1 03:47 "전달력을 훨씬 더 높이는 그런 겁니다.
이게 이제 다큐멘트 작가고 이제 이 사가지 관점에서 보면 그럼 한류 시의신은 무엇인가가 뒤에 가면서 조금씩은 감이 잡힐 것이라고 생각을 합니다.
뒤로 넘어가기 전에 보면 여러분들은 이제 우리 제ai가 나오면서 이 맨 왼쪽에 있는 루포 기자를 아마 조금"
참석자 1 04:13 "기대를 했었을 거예요. 얘는 굉장히 말을 잘하기는 하지만 사실만 말해줄 거야라고 생각을 했었는데 실제로 이제 물어보니 얘가 소설가보다 훨씬 더 소설가는 그래도 개연성이라도 있는 얘기를 할 텐데 젠 ai는 허무맹랑한 얘기들을 합니다.
대신에 이제 허무맹랑하기는 하지만 이 말 문법 자체는 말은 굉장히 그럴싸해요."
참석자 1 04:40 그걸 우리도 할루시엔이라고 얘기를 하는데 이게 왜 그러냐는 거를 그 너무 그다음부터 살펴보면 우리 이제 컴퓨팅 프로그래밍 언어의 역사를 보면 예전에는 굉장히 낮은 수준의 기계하고 대화를 하는 이 기계 코드가 앞에 사람이 쓰는 어셈블리라는 게 있죠 이거는 우리가 지금 보면 가독성이 굉장히 떨어집니다.
참석자 1 05:05 이거는 이제 옛날에는 기계와의 대화를 할 때 약간 사람의 지력을 들이더라도 기계가 알아들을 수 있게 하는 게 훨씬 더 생산성이 좋았기 때문에 그렇게 했는데 점점점 시대가 오면서 기계는 컴퓨팅 파워는 굉장히 좋아졌기 때문에 오히려 사람이 잘 이해하는 가독성이 높은 언어로
참석자 1 05:27 "이제 프로그램밍 언어가 발전을 했죠.
예를 들어서 sql 같은 경우는 굉장히 거의 자연에 가깝잖아요.
영어 자연어 약간의 문법이 있긴 하지만 그런 관점에서 보면은 우리는 계속 프로그램밍 언어라는 거는 결국 기계랑 대화를 얼마나 잘할 것인가 기계랑 대화하는 그거에 계속 연속이었던 거였어요.
이제 영화에 보면 허라는 게 있는데 여기 허에서는 그냥 말로 대화를 하죠 기계랑.
그래서 예전에는"
참석자 1 05:56 "이제 프로그램이라고 했지만 요즘에는 이제 이 제네가 나와서 그냥 프로토팅을 잘하면 되는 거 아닌가 직업이 이제 프로그래머가 아니라 그냥 프로포터가 되면 아닌가 하는 생각도 듭니다.
그리고 여기에서 하나 이제 볼 거는 처음에 이 네이밍을 잘했던 것 같아요.
프로그램밍 언어라고 얘기했잖아요 언어"
참석자 1 06:16 "이 언어라는 키워드에 오늘은 조금 집중을 해보시면 좋을 것 같습니다.
언어라는 키워드를 보면 이제 우리 자연어 철이라고 해가지고 많이 연구를 했었어요.
저도 국문학 전공을 했는데 학교 다닐 때 우리 문장에서 형태소를 분석하고 고모 분석하고 굉장히 분석을 많이 했고 이거를 조금 더 자동화하는 그런 노력들을 많이 했었는데"
참석자 1 06:38 "그럼에도 불구하고 그건 굉장히 쉽지 않았죠.
근데 그 뒤에 이제 ai가 나오면서 이게 이제 워드 트렉터라고 해가지고 이 단어들의 순서 이 단어가 오고 그다음 이전 단어, 다음 단어의 순서들 같은 경우를 이제 ai가 계산을 해서"
참석자 1 06:57 "이 순서들로부터 무언가를 우리가 파악해낼 수 있고 그렇게 되면 뭔가 번역이나 이런 것도 좀 쉽겠다.
이제 그런 시도가 있었고 그게 굉장히 발전을 했어요.
다만 역시나 이 워터세터는 컴퓨팅 자원이 많이 들고 그다지 퍼포먼스가 그렇게 좋지는 않았어요.
왜냐하면 밑에 제가 예를 들어놨는데 이제 특히 한국말 같은 경우는 아무렇게나 써도 사람은 이해를 합니다.
심지어 여기는"
참석자 1 07:24 "아무렇게나 썼지만 단어의 순서는 맞거든요.
근데 여기서 순서를 바꿔서 해도 우리는 이해를 합니다.
밑에 보면 드럽고 낡고 계단을 좋아하시는 이거를 들고 계단을 좋아하시는 분만 까세요.
낡고 이렇게 해도 우리는 의미를 이해합니다."
참석자 1 07:43 "이렇다는 거는 이제 순서만 가지고 무엇을 알아낼 수는 없다는 거예요.
근데 그런 상황에 2017년에 구글에서 트랜스포머를 발표했죠.
이 트랜스포머는 이 문장의 단어들의 순서뿐만 아니라 어텐션이나 이런 게 이제 다음에 아마 범수 님이 더 다루실 텐데 중요한 단어들에 집중하고 그 단어들이 어떻게 오고 가는지까지 많은 차원으로 분석을 해서"
참석자 1 08:10 "좀 더 정확도를 높이면서도 컴퓨팅 연산이 굉장히 더 절약되는 형태로 됐습니다.
그래서 이제 그러면 이 트랜스포머가 이제 구현된 게 지금 챗 gpt나 우리 구글의 팜 같은 lln 라지 랭기지 모델인데 그럼 얘네들은"
참석자 1 08:31 "간단하게 얘기하면 뭐냐 정확하게는 일치하지 않지만 그냥 간단하게 우리가 추상화시키자면 하나의 자동 완성입니다.
자동화 환성 자동 환성이라는 거는 1년의 단어들이 나열이 되면 그 뒤에 단어는 뭐가 올 것이다 하는 거고 1년에 단원들이라는 게 옛날에는 한 앞에 10개, 뒤에 10개 이런 식이었지만 지금은 앞에 100개, 앞에 1천개, 앞에 만 개"
참석자 1 08:57 "훨씬 더 많았죠. 그걸 이제 그 단어 하나하나를 우리가 토큰이라고 말할 수 있는데 그 토큰을 몇 개까지 다룰 수 있느냐 거의 지구상의 모든 데이터를 다룰 수 있는 수준까지 올라갔죠.
그러다 보니까 이제 그 뒤에 무슨 단어가 나오고 그 뒤에 무슨 단어고 이런 것들이 되다 보니까 이게 하나의 문장으로 마치 말을 만드는 것처럼 돼버린 거예요.
그런데 굉장히 극 단순화해서 얘기를 하면"
참석자 1 09:19 "우리 바드나 체티피티나 팜이나 이런 것들은 어떻게 보면은 하나의 오토 컴플릿 기능이다라고 보시면 될 것 같습니다.
그러면 아까 이제 오토 컴플릿 기능으로 뒤에 무슨 단어가 분당이 이렇게 되면 마치 막 말을 만들어내는 것 같은데 왜 이름을 그러면 크리vai라고 하지 않고 제너러티브 ai라고 했을까요? 혹시 이거"
참석자 3 09:46 아
참석자 1 09:47 "최창에 누군가 한번 좀 그래서 그랬을 것이다라고 말씀을 좀 누가 한번 그냥 틀려도 괜찮아요.
한번 대충 찍어보실래요? 왜 크리에이티브 ai라고 하지 않고 제너레티브 ai라고 했을까요? 이름을"
참석자 1 10:10 "네 다들 부끄러워하신 것 같은데 제가 이제 여기 이 아래쪽 그림에 놨는데 지금에 나온 이 젠 ai는 이게 이제 왼쪽에 있는 게 y예요.
뭔가의 인풋을 주면 그 인풋 하고 이 데이터 공간 데이터 공간이 지금 2차원으로 돼 있지만 굉장히 다 차원이죠 다차원 공간에서"
참석자 1 10:32 "이 인풋된 이미지와 가장 근접한 거리에 있는 이미지를 출력을 해줍니다.
지금 제가 이미지를 예로 들었는데 다른 것도 마찬가지죠.
가장 가까이 있는 거를 출력해준다는 거는 얘가 새로 만든다기보다는 이미 학습된 데이터 공간 안에 있는 곳에서 꺼내주는 거고 그 꺼내주는 것이 일련의 주변 것들까지 연결돼서 꺼내지면 마치 그게 이제 우리가 새로 뭔가 문장을 만든 것 같지만 사실은 바닥부터 새로 만든 건 아니고 있는 것에서"
참석자 1 11:03 "파생해서 만들어졌다. 그래서 제너럴티브 ai라고 말을 하는 거고요.
그러다 보니까 이제 근접한 데이터를 찾는 거 우리가 시뮬레이션 서치라고도 하는데 이 근접한 데이터를 찾기 위해서 데이터를 입력하고 꺼내고 하는 그런 거에 잘 맞는 데이터 베이스가 필요하게 되었고"
참석자 1 11:25 "그래서 이제 그 데이터베이스를 우리가 벡터 데이터 베이스라고 얘기를 합니다.
예를 들어서 코스크리 에스켈의 피지 벡터나 오픈 소스의 크롬 하나 우리 구글에서는 이제 매킹 엔진이라고 있죠"
참석자 1 11:40 "그러면 다시 좀 돌아가서 젠 ai란 뭐냐라고 살짝 말씀드리면 우리 지금 현재 젠 ai 이전의 ai를 우리가 판결형 ai 디스크림 이라고 합니다.
이전에 ai는 이 데이터 공간이 있으면 거기에 경계선을 딱 그어가지고 하나도 중복이 서로 교차되는 건 없어요.
이쪽이면 이쪽이고 저쪽이면 저쪽이에요."
참석자 1 12:04 "그래서 여기서 우리가 인풋으로 여러 가지 특질 엑스오네스트 그러니까 특성이죠 왕 특성을 집어들면 얘가 뭐라고 얘기하냐면 아 그거는 고양이예요 그거는 개예요 아니면 예스요 노예요 이렇게 딱 단답형으로 판단만 해주는 거예요.
예전의 ai는 근데 이제 제너레테이는 이 데이터 공간에서"
참석자 1 12:27 "그러니까 대동관 자체가 교차가 있을 수 있어요.
여기서는 판별이 목적이 아니에요. 인풋을 주면 예전에는 x 그러니까 특질 특질을 인풋으로 많이 줬는데 지금은 그냥 y를 인풋으로 주면 그러니까 어떤 결과죠? 결과를 주면 그 결과에 비슷한 것들을 찾아내서 가장 가까운 걸 찾아내서 그걸 돌려줍니다.
그래서"
참석자 1 12:49 "예전 거를 판대령이라고 얘기를 하고 지금 거를 생성형이라고 얘기를 하는 겁니다.
그러면 우리 여러분들 이거 아마 이제 테스트해 보고 계셨을 텐데 저희 버텍스 ai에 들어가면 인포봇이나 이런 걸 만들어볼 수 있어요.
거기에서 오른쪽에다 우리가 이 파라미터를 줄 수 있는데 여기에 이제 파라미터 중에 템퍼러치라는 게 있습니다."
참석자 1 13:15 "이 템퍼먼츠가 뭐냐 하면 예를 들어서 우리 아까 할로이시네이션 얘기를 했는데 얘가 자꾸 그럴 듯한 거짓말을 하는데 그게 나는 진짜 우리가 그라운드 트로스라고 하는데 진짜 사진만을 얘기하게 하고 싶어.
그러면 이 템퍼러처를 0으로 놓으면 얘가 창의성이 떨어진대 템퍼러시 1로 넣으면 창의성이 풍부해진대야.
그러면 템버러시를 0으로 넣으면 얘는 사실만 얘기하겠네라고 우리가 오해할 수 있습니다.
그렇지 않습니다."
참석자 1 13:42 "템퍼로치를 0으로 놔도 얘가 칼루시이 나올 수 있어요.
왜냐하면 얘가 하는 일은 뭐냐 하면 이 아까 그 데이터 공간에서 유사한 애들로 뽑아내는데 템퍼런스가 0이라는 거는 이 소트 해갖고 가장 높은 애부터 나열을 해서 얘를 오른쪽에 있는 탑기에 따라서 그만큼씩 얘를 리턴으로 줍니다."
참석자 1 14:09 "템플러스가 높다는 거는 이거를 소트한다기보다는 그냥 막 아무렇게나 막 찾아내가지고 그거를 다시 소트하는 거예요.
소트된 걸 찾아내는 게 아니라 아무렇게나 찾아낸다면 소트한 거예요.
그러니까 거기에는 이 프로볼레티가 굉장히 떨어지는 애들이 많겠죠 그중에서 몇 개를 출력하는 거예요.
그러다 보니까 우리가 창의성이라고 말할 수 있지만 엄밀하게 얘기하면 창의성 재료라고 해서 얘가 사실만을 얘기하는 건 아니다.
그냥 프로벌리티가 제 문제를 얘기하는 거죠.
그래서 하루 시신이 있을 수 있다는 거를"
참석자 1 14:41 "이해하시길 바라고요. 그러면 좀이라도 얘가 할루시네이션을 좀 줄이려면 우리가 뭘 해야 되나 약간 이제 최면슬이나 역할급 얘기를 해볼게요.
최면슬은 뭐냐 하면 당신은 지금 10년 전 학교 다니던 시절로 돌아갔습니다.
제가 학교 교장에서 누구를 만났습니다.
그때 무슨 말을 했는지 떠올려보세요라고"
참석자 1 15:06 "어떤 상황을 컨텍스트를 굉장히 좁게 규정해주죠.
역할극은 뭐냐 당신은 지금 면접관입니다.
이런 이런 면접관이 말을 했습니다. 당신은 그다음 어떤 질문하시겠습니까? 상황을 주는 거잖아요.
결국 맥락이잖아요. 이거는 뭐냐 하면 이 lln 젠ai가 지구상에 수많은 몇 페타 이상의 데이터를 학습을 했기 때문에 굉장히 잡학다 시기예요."
참석자 1 15:34 "그래서 그냥 얘기하면 얘가 어느 카테고리를 어느 커피고 얘기할지를 잘 몰라요.
그래서 얘한테 우리가 체면을 거는 거거나 역할을 주는 거야.
너는 지금 ai 개발자야 llm이 뭐야라고 얘기를 하면 라지 랭기지 보라고 얘기를 했죠.
근데 이렇게 콘텍스트를 주지 않고 그냥 얘기하면"
참석자 1 15:55 "llm 중에 굉장히 유명한 다른 무슨 법에 관련된 게 있는데 그 키워드를 줍니다.
이 llm은 너무나 많은 것을 알고 있기 때문에 그리고 너무나 많은 것을 알고 있다는 거는 사실에 기반한 걸 알고 있다기보다는 웹상에 올라와 있는 그냥 말들을 알고 있는 거죠.
그래서 그 말들 중에서 골라서 주는 거예요.
사실이냐 아니냐는 아직은 여기서는 논회고"
참석자 1 16:19 "여기서 지금 중요한 거는 어떤 컨텍스트를 주는 거죠 걔한테 그럼 그 컨텍스트에 맞는 답을 돌려주는 식으로 우리가 유도하는 거예요.
그래서 어떻게 보면 이제 체면이나 역할극 이거를 지금 우리가 보면 프롬프트 엔지니어링 또는 프롬프트 디자인이라고 말할 수 있는 거죠."
참석자 1 16:38 "혹시 여기 고양이 여기 이쪽이신 분들은 맞추실 수 있을지 모르겠는데 제가 왼쪽에 예제를 하나 들어놨어요.
거시아 거시기가 거시기여진다고 하던디 너 좀 거시기 하셨냐 이거를 좀 표준말로 누가 좀 해석을 해주실래요? 해석을 해 주시면은 가장 근접한 분께는 제가 커피를 쏘겠습니다."
참석자 1 17:06 "네 아까 렌디 님 말씀하신 그럼 맞아요.
맞아요. 남의 지식도 웹상에 올라와 있는 게 지식이 아닌 사실이 아닌 그냥 막 구화도 많겠죠 네 누군가 거시가 거시기가 거시기 하신다고 하던데 좀 거시기가 셨냐를 한번 좀 해석해 주실래요? 역시 다들 부끄러워하시는군요."
참석자 3 17:31 아
참석자 1 17:32 창현 님 최창현 님 혹시 여기
참석자 3 17:35 어
참석자 1 17:36 "어느 사인지 모르겠지만 기억하고 있다가 저희 담당자 연락 물어서 커피를 쏘겠습니다.
맞습니다. 네 주니 님도 맞습니다. 결국 뭐냐 하면 그 옆집에 개똥이한테 개똥아 니네 아버님이 아프시다고 들었는데 이제 좀 괜찮아지셨냐예요."
참석자 1 18:02 "앤디님 그것도 괜찮아요. 맞아요. 여기 굉장한 언어에 대한 역량이 풍부하신 분들이 굉장히 많네요.
네 지금 제네이한테는 우리가 이렇게 맥락을 주는 게 필요하고 이제 제네가 아직까지는 거시가 거시기가 거시 거신다고 무슨 거시기는 이거를 해석을 잘할지 모르겠어요.
근데 언젠가는"
참석자 1 18:25 "굉장히 좀 이제 이런 것까지도 다 알아들을 수 있지 않을까 생각이 들고요.
그다음에 여기서 제가 더 말씀드리고 싶었던 건 뭐냐 하면 우리가 테스트를 해보면 영문으로 했을 때는 비교적 우리가 생각한 대로 잘 나와요.
근데 한글로 하면 많이 떨어져요. 이유는 뭐냐 하면 학습한 데이터셋에 볼륨이 한글이 작기도 하겠지만"
참석자 1 18:48 "그보다 더 중요한 거는 아까도 우리 에어비엔비 리뷰 남긴 거나 지금 여기 보시면 우리 말은 같은 단어도 그거를 쌍시옷이나 쌍교 같은 강화된 단어로 바꾸거나 어슨이 막 바뀌거나 문법이 안 맞거나 해도 우리 말은 거의 다 통해요.
그래서 잘 안 되는 것 같아요."
참석자 1 19:13 "네 지금은 이제 특히나 최치p티는 좀 많이 진보 같고 저희 팜도 진보를 하고 있는데 그래도 영어 대비는 조금은 약간 아쉬운 면이 있죠.
좀 시간이 필요할 것 같습니다. 네 근데 오늘 지금 한 분만 드리기는 조금 약간 서운해서"
참석자 1 19:37 일단은 여기 제가 오른쪽에 있는 내용을 써신 내용 기억했다가 여러분들 그래도 상위 세 분까지는 드리겠습니다.
참석자 1 19:49 "그래서 이제 이게 패러다임이 시프팅을 하고 있어요.
ai 관련해서"
참석자 3 19:55 어
참석자 1 19:55 "예전에는 ai 하면 수학을 잘해야지라고 생각을 했는데 이제는 언어를 잘해야지라고 바뀌고 있는 것 같아요.
그래서 옛날에는 ai가 수리 영역이었어요.
그런데 지금은 이제 제 a가 나오면서 ai가 언어 영역이 돼버린 거예요.
그래서 저같이 어문학 전공자한테는 너무나 좋은 상황이 됐습니다.
그렇다고 수학 전공하신 분이 떠나야 되느냐 그런 건 아니죠."
참석자 1 20:24 우리가 지금 겉으로 보기에 이제 언어 요인이 됐지만 사실은 저 밑바닥에는 여전히 수확이 돌고 있는 거죠.
참석자 1 20:37 다시 처음에 제가 얘기했던 이 세 가지 직업은 전부 다 언어를 사용하는 거고 좀 더 구체적으로 글을 쓰는 거고 그 글을 써서 커뮤니케이션하고 전하고 하는 건데 루보 기자는 사실만 소설가는 하고 다큐멘터리 작가는 사실을 약간 극적인 형태로 재구성해서 전달하는 그렇게 말씀을 드렸는데 지금
참석자 1 21:05 "우리 저희 밤 또는 llm들을 그대로 사용한다고 해서 오른쪽에 있는 다큐멘터리 작가가 되지는 않는 것 같아요.
일단은 소설가인데 허무맹랑한 소설가 말을 굉장히 그럴 수 하게는 소설가는 바로 시작 가능한데 이거를 다큐멘터리 작가가 되게 만드는 거는 우리가 얼마나 프럼프트 디자인을 잘하느냐 또는 얼마나 파인튜닝을 잘하느냐"
참석자 1 21:30 "이런 것인 것 같아요. 그래서 그게 이제 결국은 우리가 고객을 만나서 이 젠 ai로 뭔가 애플리케이션을 만들어 드릴 때 결국 우리가 이런 부분에 잘 집중을 해서 이 허무맹랑한 소설가가 되지 않게 만드는 게 이제 필요한 거죠.
아마 루포 기자가 되는 거는 굉장히 쉽지는 않을 것 같습니다."
참석자 1 21:54 돋보기자가 되게 하려면 이 지구상의 데이터셋을 다 넣으면 안 되고 딱 그 도메인에 개만 넣어가지고 예전의 방식으로 별도의 모델을 돌려야 되겠죠 지금은 우리가 돌리는 llm은 제 뒤에 들어가면 프로즈 모델이 있고 프로드 모델은 이제 몇 가지가 있죠 우리 모달리티 별로 그 뒤에는 제네릭 모델이 있는데 걔는 변하지 않는 고
참석자 1 22:20 "있는 지구상의 모든 데이터를 학습한 애예요.
거기다가 우리가 추가적으로 프롬프팅이나 파인피닝을 하는 거기 때문에 개의 지식을 다 없앨 수는 없어요.
걔 지식을 다 없애야만 노포기자가 될 수 있는데 걔는 지식이 워낙 많기 때문에 그러니까 여기 소설가가 지금 책을 무지 많이 읽은 것처럼 이 무지만이 읽는 그런 지식을 갖고 있기 때문에 걔한테는 컨텍스트를 주고 무언가 우리가 지시를 잘해야 이 허무맹랑한 소설계가 아니라"
참석자 1 22:49 "그럴 듯한 굉장히 말이 되고 재미있게 구생했네라는 다큐멘터리 작가가 될 거라고 생각을 하고 있습니다.
그래서 여기까지 오늘 좀 일반인에게 좀 알아들을 수 있으면라고 저는 노력을 해서 좀 말씀을 드렸는데 여러분들 알아들으셨는지 모르겠는데 그리고 오늘 슬라이드도 잘 보시면 제가 스스로 막 작성한 게 없어요.
다 웹상에 있는 이미지 이런 거 가져다가"
참석자 1 23:16 "구성을 했어요. 구성했다는 걸 제가 창작한 게 아니라 제 에너레이션을 했다는 걸 생성한 것입니다.
이거를 기억해 주시고 지금까지 해주셔서 감사하고 네 그러면 조금만 관련해서 혹시 질문이 있으시면 질문을 받고 다음 아젠다로 넘어갈게요."
참석자 1 23:46 "네 현주님. 네 이제 우리 제 ai는 하여튼 웹상에 있는 모든 데이터를 공부하다 보니 사투리도 많이 공부를 한 것 같습니다.
네 현용 님 말씀하세요. 현영 님 말씀하세요."
참석자 1 24:08 형수님이 뭔가 이렇게 잘못 누르셨나 네 네 잘못 누르셨고 네 선생님
참석자 1 24:18 이 타케이 타키는 지난 시간에 우리 봉수 님이 아주 잘 말씀해 주셨는데 한번 다시 볼게요.
참석자 1 24:30 "네 여기에서 보면 이제 여기에 템퍼러처 템퍼러처는 랜덤 니스죠 그다음에 여기에 이제 탑 케이는 뭐냐 하면 이렇게 이제 어쨌든 사전 소팅을 하든 사우 소팅을 하든 소팅을 했어요.
프로리 기준으로. 그래서 이를 만약에 3으로 두면 위에서 3개만 나오는 거죠 위에서 3개만 그러면 커피는 뭐냐"
참석자 1 24:55 "이거는 탑 케이는 개수를 세 개를 세는 거고 탑피는 개수가 아니라 썸을 하는 거예요.
만약에 타피를 0.5로 하면 프라버빌리티를 쭉 합쳐보니 여기는 밑에까지 다 합쳐야 0.5가 돼.
그러면 5개를 다 리턴으로 주는 거고 두 번째는 여기 두 개만 합쳐도 0.5가 돼.
그러면 두 개만 추는 거예요. 이해되셨나요?"
참석자 3 25:24 네
참석자 1 25:34 "네 여기는 오늘 제가 이제 창현 님 말씀하신 굉장히 중요한 질문을 하셨는데 제가 오늘 첫 세션에 굳이 왜 한루 시네시란 얘기를 했을까? 이거는 llm이 기본적으로 가지고 있는 특성이에요.
그래서 여기가 우리가 이제 인퍼봇을 만들든 서치 엔진을 만들든 만약에 우리가 쓸 앱을 고객 하나로 만든다 하면"
참석자 1 26:01 "거기에는 우리가 아무리 튜닝을 잘해도 이 헐리쉐이션이 있을 수 있다는 거를 고객도 알아야 되고 그래서 거기 검색 결과에 나오면 이게 선머리도 있고 스니펫도 있지만 그 밑에는 링크가 달리잖아요.
그래서 인트라넷 같은 경우는 인트라 라레지 같은 경우는 내부 문서 링크가 있을 거예요.
gch가 올린 그러면 결국 사용자들은 거기서 나열된 이 글을 보긴 보지만 그 문서에 들어가서 한 번 더 확인을 해야 되겠죠."
참석자 1 26:31 그래서 이거는 제가 봤을 때는 전반적으로 ai 제조사의 일방적으로 책임이 있다기보다는 지금 전 세계적으로 막 이런 규약이나 이런 것들이 만들어지고 있는데 responsev ai나 ai 거버넌스 같은 얘기했는데 예를 들어서 세이프티 필터 같은 거 가지고 뭔가 좋지 않은 것들을 걸러내는 이거는 제조사들이 다 열심히 할 거예요.
참석자 1 26:54 "그렇지만 거기서 걸러지지 않는 개별 사실 이게 사실이냐 아니냐 이런 것들은 결국 사용자가 사용하는 팀에서 잘 관리를 해야 된다고 생각을 합니다.
어느 한쪽은 명확하게 지금은 아닌 것 같아요.
그리고 약간은 이런 법제 같은 것들이 만들어지고 있는 과도기 상태고 다만 구글에서는"
참석자 1 27:16 "저희가 최선을 다해서 저희가 할 수 있는 부분들을 하고 있습니다.
그래서 저희는 토픽 중요한 토픽 하나가 디스판서버 ai 그다음에 ai 거버넌스 그다음에 ai 스크립트 이런 저희 같이 돌고 있고요.
그러다 보니까 저희가 어떤 제네의 피처들이나 프로세스를 추진하는 게"
참석자 1 27:34 "타사보다 좀 느린 경향이 있습니다. 그런 모든 것들을 다 체크하고 통과해야 저희가 릴리즈를 하거든요.
그렇게 이해해 주시면 좋을 것 같습니다.
혹시 또 질문 있으신가요?"
참석자 1 27:57 "네 엔진이 맞습니다. 이게 특정 케이스 바이 케이스로 아마 그런 대응이 될 것 같고 우리가 한 방에 이렇다 저렇다라는 거는 말하기 쉽지 않을 것 같아요.
대신에 이제 저희가 세션이 진행되면서 구글이 준비하고 있는 response몰 ai 아이 거버넌스 이런 내용이나 문서들은 이제 시스템 중에 내용으로 들어갈 겁니다."
참석자 1 28:21 "일단 개괄적인 탈러시라고 좀 보시면 될 것 같습니다.
네 그러면 일단 왜 할루시네이션인가는 이제 여기까지 마치고 다음은 이제 qna 여러분들이 써주신 qna로 넘어갈게요."