LangChain KR x NAVER Cloud 생성형 AI 서비스 개발 프로젝트 지원하기
2024.04.25 - 2024.06.23
0
100만원 네이버페이 + 150만원 크레딧
3758
6
공유
6
공유
글쓰기
총 48

네이버 클로바의 주요 기능

네이버 클로바(Clova)는 네이버(Naver)와 라인(Line)이 공동으로 개발한 인공지능(AI) 플랫폼으로, 사용자에게 다양한 AI 기반 서비스와 기능을 제공하는 것을 목표로 하고 있습니다. 클로바는 'Cloud Virtual Assistant'의 약자로, 네이버의 검색 기술과 라인의 메신저 기능을 결합하여 사용자의 생활을 더욱 편리하고 스마트하게 만들어줍니다.클로바의 주요 기능음성 인식 및 음성 합성 클로바는 고도화된 음성 인식 기술을 통해 사용자의 음성을 정확하게 인식합니다. 이를 통해 사용자는 음성 명령으로 다양한 작업을 수행할 수 있으며, 텍스트를 자연스러운 음성으로 변환하는 음성 합성 기능도 제공합니다. 이러한 기술은 스마트 스피커, 모바일 앱 등 다양한 디바이스에서 활용됩니다.자연어 처리 클로바의 자연어 처리(NLP) 기술은 사용자의 질문을 이해하고 적절한 답변을 제공할 수 있게 합니다. 이는 검색, 대화형 서비스, 고객 지원 등에 활용되며, 사용자와의 자연스러운 상호작용을 가능하게 합니다.이미지 및 비디오 분석 클로바는 이미지와 비디오를 분석하여 객체 인식, 얼굴 인식, 장면 분석 등을 수행할 수 있습니다. 이는 사진 관리, 보안, 미디어 분석 등 다양한 분야에서 유용하게 사용됩니다.추천 시스템 클로바는 사용자의 취향과 행동을 분석하여 개인화된 추천을 제공합니다. 이는 뉴스, 쇼핑, 음악 등 다양한 콘텐츠에서 사용자에게 맞춤형 제안을 하는 데 도움이 됩니다.클로바의 적용 사례클로바 스피커 클로바 스피커는 음성 명령을 통해 음악 재생, 일정 관리, 날씨 정보 제공 등 다양한 기능을 수행하는 스마트 스피커입니다. 사용자는 간단한 음성 명령만으로도 손쉽게 다양한 정보를 얻을 수 있습니다.클로바 앱 클로바 앱은 스마트폰에서 사용할 수 있는 AI 비서로, 음성 명령을 통해 메모 작성, 전화 걸기, 메시지 보내기 등의 작업을 수행할 수 있습니다. 또한, 클로바 램프 등 다양한 IoT 기기와 연동되어 스마트 홈을 구현하는 데 기여합니다.네이버 서비스 네이버의 검색, 쇼핑, 뉴스 등 다양한 서비스에 클로바의 AI 기술이 적용되어 사용자에게 더욱 편리하고 유용한 기능을 제공합니다. 예를 들어, 네이버 검색에서 사용자는 음성으로 검색어를 입력하거나, 이미지 검색을 통해 원하는 정보를 쉽게 찾을 수 있습니다.

미송
0

Faster Segment Anything (MobileSAM)

Motivation: For the ViT-based image encoder, the official release includes three models with different parameter sizes: ViT-H (632M), ViT-L (307M), and ViT-B (86M), as shown in the following table.Although ViT-H can achieve the best performance, it has large parameters, which makes it hard to deploy at the edge side. How to strike a balance between model size and performance, achieving a significant reduction in model parameters compared to ViT-H while maintaining performance comparable to official ViT-H?Coupled & Semi-coupled Distillation: A straightforward way to realize the project goal is to follow the official pipeline to retrain a new SAM with a smaller image encoder. As stated in Kirillov et al. [2023], training a SAM with a ViT-H image encoder requires 68 hours on 256 A100 GPUs.Replacing the ViT-H with ViT-L or ViT-B reduces the required GPUs to 128, which is still a non-trivial burden for many researchers in the community. So the authors adopt an even smaller image encoder which we will talk about later. From Semi-coupled to Decoupled Distillation: To alleviate the optimization issue of coupled distillation, a way is to optimize the image encoder with a copied and frozen mask decoder.The optimization of the image encoder is still not fully decoupled from the mask decoder.Since the choice of a prompt is random, it makes the mask decoder variable and thus increases the optimization difficulty.Therefore, the authors propose to distill the small image encoder directly from the ViT-H in the original SAM without resorting to the combined decoder, which is termed decoupled distillation (Figure 3). Another advantage of the decoupled distillation is that the generated image encoding from the student image encoder can be sufficiently close to that of the original teacher encoder, which renders finetuning on the combined decoder in the second stage optional.It is expected that finetuning the mask decoder on the frozen lightweight image encoder or jointly finetuning them together might further improve the performance. Preliminary Evaluation: The authors conduct a preliminary investigation to compare coupled distillation and decoupled distillation.The mask generated by ViT-H is the ground-truth.For the coupled distillation, the authors adopt the SAM with ViT-B provided in the original SAM Kirillov et al. [2023].It was trained on SA-1B (11M images) on 128 GPUs (1 sample per GPU) for 180k iterations.By contrast, in the decoupled distillation setup, the authors train the model on 2 GPUs (two samples per GPU).The authors used 0.1% samples of SA-1B dataset (11k) images for 55k iterations.For performance evaluation, they compute the mIoU. Experimental Setup: The authors adopt ViT-Tiny for the proof of concept to demonstrate the effectiveness of our proposed decoupled distillation for training a lightweight MobileSAM. The parameters and inference speed of MobileSAM are summarized in the following table. Training and Evaluation Details: The authors train the lightweight encoder with 1% of the SA-1B dataset Kirillov et al. [2023] for 8 epochs on a single GPU.With a single GPU, the authors obtain our MobileSAM in less than a day.The results in Table 4 show that, under the same number of iterations, increasing the batch size increases the model performance.Similarly, under the same batch size, the performance also benefits from more iterations as well as more epochs.Note that all the experiments are conducted on a single GPU. Increasing the number of GPUs to allow a larger batch size or further increasing the iterations can further improve the performance.Results: Comparisons between SAM, FastSAM, and MobileSAM are demonstrated below:

Sumit K. Dam
0

법률 조언 챗봇 서비스

지능형 법률 조언 챗봇서비스 개요지능형 법률 조언 챗봇은 사용자가 법률 문제에 대한 기본적인 조언을 쉽게 받을 수 있도록 돕는 AI 기반의 도구입니다. 이 챗봇은 법률 문서와 사례 기록, 규제 정보를 학습하여 사용자에게 맞춤형 법률 정보를 제공합니다. 이 서비스는 주로 기업, 개인, 중소기업을 대상으로 하며, 법률 상담 비용을 줄이고 접근성을 높이는 데 중점을 둡니다.주요 기능법률 정보 제공일반 법률 지식: 사용자에게 일반적인 법률 용어와 개념을 설명합니다.법률 문서 이해: 계약서, 조항, 정책 등의 법률 문서를 쉽게 이해할 수 있도록 해석하고 요약합니다.법률 상담법률 질문 답변: 사용자가 입력한 법률 관련 질문에 대해 구체적이고 맞춤형 답변을 제공합니다. 예를 들어, 고용법, 상법, 지적 재산권 등에 관한 질문을 처리할 수 있습니다.사례 기반 조언: 과거 사례를 바탕으로 유사한 상황에서의 법적 결과를 예측하고 조언합니다.규제 준수 확인규제 정보 업데이트: 최신 법률 및 규제 정보를 데이터베이스에 업데이트하여 사용자에게 최신 정보를 제공합니다.규제 준수 체크리스트: 사용자가 특정 법률이나 규제를 준수하고 있는지 확인할 수 있도록 체크리스트를 제공합니다. 예를 들어, 개인정보 보호법(GDPR) 준수 여부를 평가할 수 있습니다.법률 문서 생성문서 템플릿 제공: 사용자 입력을 기반으로 표준 법률 문서 템플릿을 제공합니다. 예를 들어, 비밀유지 계약(NDA), 고용 계약서 등을 생성할 수 있습니다.맞춤형 문서 작성: 사용자가 제공한 정보를 바탕으로 맞춤형 법률 문서를 작성합니다.  지능형 법률 조언 챗봇은 법률 정보와 기술을 결합하여 보다 접근성 높고 비용 효율적인 법률 서비스를 제공할 수 있습니다. 이를 통해 법률에 대한 지식이 거의 없는 일반인도 법률 지식에 쉽게 접근할 있도록 하여 법률적 문제 해결에 큰 도움을 줄 수 있습니다.

ㅁㅇ
0

NAVER 클로바 스튜디오 사용 방법

주요 메뉴 구성1> 플레이 그라운드 : 파라미터를 조절해 결과값의 세부 사항을 설정할 수 있는 메뉴 (프롬프트를 활용해 가장 기본적인 질문/답변을 원하는 형태로 출력 조율한 값을 기반으로 API 생성 가능)2> 튜닝 : 기업 맞춤형 데이터로 모델을 학습 (자신만의 정보나 특화 모델을 구축하여 AI 제작 )3> 익스플로러 : AI 제작 작업에 활용할 도구 (임베딩 API 및 데이터 확장, 토근 계산기, 요약 등 제공)4> 스킬 트레이너 : 모델 외부 서비스 API와 연결 (특화 지식을 모델에 학습시켜 최신 정보를 반영한 답변 제공)위에 사항들은 ChatGPT에서 제공하는 GPTs를 통해 나만의 챗봇 만들기에서 사용했던 기능들과 유사함을 느꼈습니다.  다만 ChatGPT에서도 이를 기업용으로 사용하려면 좀 더 개발자적인 지식이나 스킬이 필요했는데 네이버에서 제공하는 클로바 스튜디오는 이를 좀 더 친숙하게 설계한 느낌이 듭니다. 실제 성능에 대해서는 좀 더 확인이 필요하겠습니다 주요 기능플레이 그라운드에 실제 내용을 입력해서 전체 구조를 확인해봤습니다. 크게 총 5가지 파트로 구성되어 있습니다.1> 파라미터(좌측 세로) : 텍스트 생성을 위해 토큰 값, 엔진, Temperature 조정 등 2> 우측 최상단 : 토큰 수 계산, 공유, 테스트앱(API ) 등 수행 3> 우측 하단 : 제목 입력, 시스템(사전에 AI 모델에 지시 입력값), 사용자(질문), 어시스턴트(AI에서 답변 받은 값)  파라미터하나씩 살펴보면 상단에서 모드는 일반 모드, 챗 모드를 제공하고 그에 대응하는 엔진을 제공합니다. 엔진은 성능에 따라 나뉘고 그에 따라 토큰에 대한 비용이 설정될 것으로 보입니다. ChatGPT 3.5, 4.0과 같은 엔진 개념으로 보입니다.Top P와 K가 조금 생소했는데, Top P는 0~1로 설정이 되며 누적 확률 값에 대한 설정인데, P 값으로 설정한 누적 확률 값에 포함되지 않는 토큰은 결과값에서 제외된다고 합니다. 즉, Top P가 0.8이라면 상위 80% 확률에 포함된 토큰에서만 결과값이 생성됩니다.Top K는 0~128 사이로 설정이 되는데 다양한 후보 중 확률 값이 가장 높은 K중 하나를 선택하게 하는 값이며 일반적으로 0으로 둡니다.위에 2개 값은 결국 하단의 Temperature 기능과 연결될 것으로 보입니다.생성형AI 모델은 기본적으로 정답을 찾는 것이 아니라 수 많은 데이터를 학습하여 가장 유사도가 높은 데이터 패턴에 따라 텍스트, 이미지, 영상 데이터 등을 생성하는 모델입니다. 즉, Temperature는 0~1로 설정이 되어서 문장의 다양성을 조절하는 값인데 다양성을 조정하면서도 Top P, K를 통해 유사도가 높은 데이터 패턴의 값들을 커스텀해 나가기 위한 설정 기능으로 보입니다.맥시멈 토큰은 AI가 생성하는 결과값의 최대치 입니다. 최대 4096토큰까지 생성이 됩니다.Repetition penalty는 0~10까지 설정되며 AI가 답변을 생성할 때 동일 토큰에 감점 요소를 부여하는 값으로 값이 낮으면 같은 결과를 반복 생성할 확률이 높습니다.마지막으로 Stop sequences는 결과값 생성 시 출력을 중단할 때 사용되며 예를 들어 ‘사자’를 입력해두면 결과값에 ‘사자’라는 단어가 나오면 그 전까지만 출력이 됩니다. 아마도 폭력적이거나 선정적인 내용, 보안에 관련된 사항 등이 언급될 때 사용될 것으로 보입니다.

augi_cos
1

네이버 클로바 클라우드의 음성 인식 기능 및 활용

네이버 클로바 클라우드는 음성 인식 기술을 API 형태로 제공하여, 개발자가 손쉽게 자신의 애플리케이션에 음성 인식 기능을 추가할 수 있게 해줍니다. 이를 통해 음성 명령을 이해하고 처리하는 애플리케이션을 개발할 수 있습니다. 클로바 클라우드의 음성 인식 API 사용 방법네이버 클라우드 플랫폼 가입 및 로그인: 네이버 클라우드 플랫폼에 가입한 후 로그인합니다.프로젝트 생성: 클라우드 콘솔에서 새로운 프로젝트를 생성합니다.음성 인식 API 활성화: 클로바 음성 인식 API를 활성화합니다.API 키 발급: API를 사용하기 위해 필요한 키를 발급받습니다.API 호출: 발급받은 키를 사용하여 애플리케이션에서 음성 인식 API를 호출합니다. 예제 코드를 참고하여 자신의 코드에 적용할 수 있습니다. 클로바 스튜디오는 비개발자도 쉽게 사용할 수 있는 직관적인 인터페이스를 제공하여, 음성 인식 기능을 활용한 AI 모델을 쉽게 개발하고 배포할 수 있습니다.클로바 스튜디오 사용 방법클로바 스튜디오 접속: 네이버 클로바 스튜디오 웹사이트에 접속합니다.프로젝트 생성: 새로운 프로젝트를 생성합니다.음성 데이터 업로드: 음성 인식 모델 학습에 필요한 음성 데이터를 업로드합니다.모델 학습: 업로드한 데이터를 기반으로 AI 모델을 학습시킵니다.모델 배포: 학습된 모델을 배포하여 실제 애플리케이션에 적용합니다. 

kiiae
0

LLM을 통한 생성형 AI 서비스 개발

대규모 언어 모델(LLM, Large Language Model)을 통한 생성형 AI 서비스 개발은 현대 인공지능 기술의 중요한 진전 중 하나로, 다양한 산업 분야에서 혁신적인 응용 프로그램을 가능하게 하고 있습니다. LLM은 방대한 양의 텍스트 데이터를 학습하여 자연어 이해와 생성 능력을 갖춘 모델로, 이러한 모델을 활용하면 매우 다양한 생성형 AI 서비스를 구현할 수 있습니다.LLM의 특징과 강점LLM의 주요 특징 중 하나는 문맥을 이해하고 일관성 있는 텍스트를 생성할 수 있는 능력입니다. 이는 단순한 패턴 인식에 그치지 않고, 텍스트의 의미와 뉘앙스를 이해하여 더욱 자연스러운 언어 생성이 가능하게 합니다. GPT-3, BERT, T5와 같은 LLM들은 이미 많은 연구와 실험을 통해 그 성능을 입증받았습니다.생성형 AI 서비스의 다양한 응용 분야콘텐츠 생성: LLM을 활용하면 자동으로 기사, 블로그 포스트, 제품 설명 등을 생성할 수 있습니다. 이는 콘텐츠 제작에 드는 시간과 비용을 절감할 수 있으며, 특히 다량의 콘텐츠가 필요한 마케팅과 출판 산업에서 유용합니다.고객 서비스: 챗봇과 가상 비서와 같은 고객 서비스 애플리케이션에 LLM을 적용하면, 고객의 질문에 대한 더 자연스럽고 정확한 응답을 제공할 수 있습니다. 이는 고객 만족도를 높이고, 기업의 서비스 효율성을 향상시킬 수 있습니다.번역 및 언어 지원: LLM은 고품질의 번역 서비스를 제공할 수 있으며, 다양한 언어에 대한 이해도를 바탕으로 글로벌 커뮤니케이션을 지원합니다. 이는 다국적 기업이나 언어 장벽을 넘어선 협업이 필요한 상황에서 큰 도움이 됩니다.교육 및 학습 도구: 개인 맞춤형 학습 경험을 제공하는 교육용 AI 도구에 LLM을 활용하면, 학생들의 질문에 실시간으로 답변하거나, 학습 자료를 생성할 수 있습니다. 이는 교육의 질을 향상시키고 학습 효율성을 높입니다.LLM을 활용한 서비스 개발의 과제LLM을 통한 생성형 AI 서비스 개발에는 몇 가지 과제가 있습니다. 먼저, 대규모 모델을 학습하고 운영하는 데는 막대한 계산 자원과 비용이 필요합니다. 또한, 생성된 텍스트의 정확성과 신뢰성을 보장하기 위해 지속적인 모니터링과 조정이 필요합니다. 마지막으로, 데이터 프라이버시와 윤리적 문제도 중요한 고려사항입니다.결론LLM을 통한 생성형 AI 서비스 개발은 다양한 산업에 걸쳐 혁신적인 솔루션을 제공할 수 있는 잠재력을 가지고 있습니다. 콘텐츠 생성, 고객 서비스, 번역, 교육 등 여러 분야에서 LLM의 활용은 이미 현실화되고 있으며, 앞으로도 더욱 발전할 것입니다. 이러한 기술적 진보는 기업의 운영 효율성을 높이고, 사용자 경험을 향상시키며, 궁극적으로는 더 나은 사회를 만드는 데 기여할 것입니다.

M000NNY
1

네이버 클로바 스튜디오와 네이버 웹툰

 클로바 스튜디오란?초 대규모 AI 하이퍼 클로바를 기반으로 한 No Code AI튜닝으로 AI에 개성을 불어넣음.이를 이용하여 현재 네이버 웹툰에서는 생성형 AI 하이퍼클로바X를 기반으로 하는 AI 챗봇, 캐릭터 챗을 서비스 중이다.메세지 30건은 1500원, 100건은 5000원, 300건은 1만 5000원에 판매 중이다.AI를 이용하여 수익성을 올릴 새로운 콘텐츠이다 

발가락
0

네이버 클로바 OCR 모델 사용해보기!

안녕하세요! LangChain KR x NAVER Cloud 생성형 AI 서비스 프로젝트 기간이 얼마 남지 않았습니다.진행하시는 분들 모두 끝까지 화이팅하시길 바랍니다! 서비스 개발에 도움이 되었으면 하는 마음으로, CLOVA OCR 서비스를 사용하는 방법에 대해 공유하고자 합니다!NAVER Clova OCR 서비스 신청하기 먼저, 콘솔에 들어가 CLOVA OCR 서비스로 들어가줍니다.  일반/템플릿 버전으로 도메인을 생성해주고, 도메인명을 아무렇게나 만들어줍니다.  도메인이 잘 생성되었는데, 이제 API Gateway와 연동을 해야합니다.그전에! 먼저 API Gateway를 검색해서, 사용신청이 되어있는지 확인해주세요.API Gateway 사용신청이 되어있다면, 이제 CLOVA OCR에서 API Gatewayt 연동 버튼을 클릭해줍니다.위 화면에서 Secret Key를 생성하고, APIGW Invoke URL도 확인할 수 있습니다!만약 이 화면이 나오지 않고 API Gateway 자동연결 버튼이 나온다면, 자동연결 버튼을 눌러 API Gateway와 연동해주시면 되겠습니다. Google Colab에서 사용해보기<code class="language-plaintext">import time import pandas as pd import cv2 import json import matplotlib.pyplot as plt import shutil import os import random from PIL import Image import requests import uuid import time import json ############################ Edit! secret_key = 'Secret Key' api_url = 'APIGW Invoke URL' image_file = 'Image path' ############################ # Setting up the request JSON request_json = { 'images': [ { 'format': 'jpg', 'name': 'demo' } ], 'requestId': str(uuid.uuid4()), 'version': 'V2', 'timestamp': int(round(time.time() * 1000)) } payload = {'message': json.dumps(request_json).encode('UTF-8')} files = [('file', open(image_file,'rb'))] headers = {'X-OCR-SECRET': secret_key} # Make the OCR request response = requests.request("POST", api_url, headers=headers, data=payload, files=files) # Load the original image for visualization image = cv2.imread(image_file) highlighted_image = image.copy() # OCR 응답 처리 if response.status_code == 200: ocr_results = json.loads(response.text) all_texts = [] # 모든 텍스트를 저장할 리스트 for image_result in ocr_results['images']: for field in image_result['fields']: text = field['inferText'] all_texts.append(text) # 텍스트 추가 # 텍스트 주변에 빨간 사각형 그리기 bounding_box = field['boundingPoly']['vertices'] start_point = (int(bounding_box[0]['x']), int(bounding_box[0]['y'])) end_point = (int(bounding_box[2]['x']), int(bounding_box[2]['y'])) cv2.rectangle(highlighted_image, start_point, end_point, (0, 0, 255), 2) # 모든 텍스트를 띄어쓰기로 연결하여 출력 full_text = ' '.join(all_texts) print(full_text) else: print(f"OCR 결과를 받아오지 못했습니다. 상태 코드: {response.status_code}") # Display the original and highlighted images side by side fig, axs = plt.subplots(1, 2, figsize=(15, 10)) axs[0].imshow(cv2.cvtColor(image, cv2.COLOR_BGR2RGB)) axs[0].set_title('Original Image') axs[0].axis('off') axs[1].imshow(cv2.cvtColor(highlighted_image, cv2.COLOR_BGR2RGB)) axs[1].set_title('Highlighted Image') axs[1].axis('off') plt.show()</code> output<code class="language-plaintext">제품명 한우 소불고기 전골 식품유형 간편조리세트(가열하여 섭취하는 냉동식품) 소비기한 제품 별도 표기일까지 품목보고번호 202003630271059 소스[양조간장(탈지대두/오국산), 설탕, 양파(국산), 마늘, 청주], 소고기(설도, 한우/국산), 숙면[밀가루 원재료명 (밀/호주산), 전분가공품{감자전분(독일산 99 %, 국산 1 %)}, 면류첨가알칼리제(정제수, 탄산나트륨, 탄산수소나트륨), 정제소금], 팽이버섯, 양파, 대파 대두, 밀, 쇠고기 함유 제조원 (주)프레시지/경기도 용인시 처인구 이동읍 삼배울로 23 보관방법 -18°C 이하 냉동보관 반품 및 교환 구입처 및 판매원 내포장재질 PE 고객상담전화 1833-5836 </code> CLOVA OCR은 한국기업인 NAVER에서 제공하는 서비스라 그런지, AWS나 GCP에 비해 한글을 잘 찾아주는 것 같습니다.바운딩 박스를 봐도, 곂치는부분 없이 깔끔합니다. 사용하실 때는, 위 코드에서 secret_key, ,api_url, image_file 를 수정하면 됩니다! 이 글이 도움이 되셨으면 좋겠습니다.감사합니다!

cocudeny
0

네이버 CLOVA Studio 사례

네이버 클로바 스튜디오 사례 1. AI CareCallCLOVA Contact Center에서 제공하는 서비스에는 AiCall, HappyCall, CareCall이 있다.먼저 AiCall은 소상공인부터 기업 고객센터까지 전화를 통한 문의 응대 및 예약 등을 진행할 수 있는 대화형 AI 서비스입니다. 콜센터, 고객센터 둥에 적합한 서비스이다.다음으로, HappyCall은 보험, 증권, 리서치 등의 업종에서 전화를 통한 고객 만족도 조사 및 불완전 판매 모니터링 업무를 수행할 수 있는 AI 서비스이다. 은행, 보험 회사 등에 적합한 서비스이다.마지막으로, CareCall은 일상적인 주제로 자유롭게 대화를 나누며 사용자의 건강 상태를 확인하는 AI 전화 돌봄 서비스이다. 주위 사람들의 시선이 자주 닿기 힘든 1인 가구, 독거노인 대상으로 탁월한 서비스이다.사용해보면 사투리도 인식한다. 정구지라고 말해도 표준어로 부추임을 인지한다. 따라서 경기권에 거주하지 않는 사용자도 편하게 쓸 수 있다.또한 농담도 가능하다. 따라서 사용자들과 친밀한 대화가 가능하다.행정복지센터 같은 곳에서 매일 독거노인 가구를 방문하기 힘드니 CLOVA CareCall로 인건비를 아끼고,대화에서 발생할 수 있는 감정 소모도 없는 훌륭한 복지 서비스가 될 수 있을 것이다. 2.  네이버 CLOVA Note네이버 CLOVA Note는 AI 기술을 활용한 음성 기록 관리 서비스이다.회의, 강의, 상담, 인터뷰 등 녹음이 필요한 모든 상황에 편리하게 이용이 가능하다. 특히 대화 내용을 집중해서 듣거나 직접 참여해야 할 때 유용하다.녹음한 내용이 텍스트로 변환되고 AI 기술이 핵심 내용만 요약해 주기 때문에 요점을 한눈에 파악하기 쉽고 필요한 구간만 찾아서 바로 들어볼 수도 있다. 노트 생성 모바일 앱 또는 PC에서 녹음을 시작하거나 저장된 음성 파일을 업로드해서 노트를 생성할 수 있다. 만약 업로드할 파일이 준비되지 않았거나 녹음을 시작하기 어려운 경우라면, 새 노트를 먼저 준비할 수 있다. 새 노트에 제목, 참석자, 주제 등을 미리 메모해놓으면 실제 녹음할 때 중요한 내용을 놓치지 않을 수 있다.  노트 편집 텍스트로 변환된 음성 기록과 직접 작성한 메모, AI가 자동으로 정리해주는 요약, 주요 주제, 다음 할 일까지 모두 수정할 수 있다. 뿐만 아니라, 음성 기록에서 강조할 내용이 있다면 길게 눌러서 하이라이트 표시하거나 메모 또는 북마크를 추가하는 것도 가능하다.  생성 노트 다운로드 / 공유 녹음한 음성 파일, 텍스트로 변환된 음성 기록, 메모까지 모두 파일로 다운로드할 수 있다. 다양한 파일 형식을 지원하기 때문에 원하는 포맷을 선택할 수 있다. 또한, 생성된 노트를 링크로 공유할 수 있다. 공유 링크를 통하면 편집한 내용까지 바로 확인할 수 있어 매우 간편하다.  노트 생성 시 사용 시간 차감? 클로바노트는 매월 기본 제공되는 시간만큼 무료로 사용가능 기본 제공 시간은 매월 갱신일까지 사용 가능하며, 사용 시간은 노트를 만들 때 녹음 또는 업로드할 파일의 길이에 따라 차감된다. 예를 들어, 5분짜리 노트를 만들면 5분의 사용 시간이 차감된다. 기본 제공 시간은 변경될 수 있으며, 남은 사용 시간은 이월되지 않고 갱신일에 자동 소멸된다.

wxxhe
0

네이버가 제공하고 있는 생성형 AI 서비스 조사

현재 네이버에서 제공하고 있는 생성형 AI를 이용한 서비스들을 조사해보고자 합니다.https://clova.ai/hyperclova 위 링크에서 현재 제공하고 있는 서비스들을 전반적으로 볼 수 있습니다.하나씩 살펴보면 다음과 같습니다.AI를 이용한 상품 상세 설명 페이지 만들기 가비아CNS는 쇼핑몰 창업, 마켓 통합관리, 해외 진출, 광고·마케팅, 홈페이지 제작까지 커머스 인프라와 서비스를 제공하는 커머스 전문 기업입니다. 가비아CNS에서 제공하는 서비스 중 하나는 네이버의 멀티모달 모델인 하이퍼클로바를 사용해 고객들이 맞춤형으로 상세 페이지를 만들 수 있게 도와주는 툴을 제공하는 서비스입니다. 이 서비스를 사용하면 자신의 상품을 쿠팡, 컬리 등에 등록하고 싶지만 상세 페이지를 제작할 기술이 없는 고객들이 비교적 저렴한 비용으로 상세 페이지를 만들 수 있을 것 같습니다. 레터비 : 생성형 AI를 이용한 자기소개서 생성 서비스 디피랩에서 제공하는 생성형 AI를 이용한 자기소개서 작성 서비스에 하이퍼클로바가 사용되었습니다. 자기소개서 작성은 모든 사람들에게 쉽지 않은 일입니다. chatGPT 등 여러 글로벌 기업의 거대 챗봇은 훌륭한 작문 실력을 자랑하지만, 사람들을 감동시킬 만한 특이하고 특별한 글을 쓰는 것에 특화되어 있지는 않습니다. 그리고, 한국어를 잘하지만 메인 언어는 아니죠. 그런 측면에서, 현 시점 한국어를 가장 많이 학습한 거대 생성형 AI 모델인 하이퍼클로바를 사용한 서비스가 자기소개서 작성에는 가장 도움이 될 것 같습니다. 이외에도 많은 서비스들이 있습니다. 본 공모전을 통해 새로운 서비스들이 많이 개발되었으면 좋겠습니다. 감사합니다.  

쌀국수먹고싶다
0

CLOVA AI SERVICES

네이버 CLOVA (Cloud Virtual Assistant) AI Service는 네이버가 개발한 인공지능 기반의 다양한 서비스를 제공하는 플랫폼입니다. CLOVA는 다양한 AI 기술을 활용하여 사용자에게 유용한 기능을 제공하며, 주요 서비스는 다음과 같습니다:CLOVA Voice: 음성 인식 및 합성 기술을 기반으로 한 서비스로, 음성을 텍스트로 변환하거나 텍스트를 자연스러운 음성으로 변환하는 기능을 제공합니다.CLOVA OCR: Optical Character Recognition 기술을 이용하여 이미지나 문서에 포함된 텍스트를 인식하고 추출하는 서비스입니다. 이를 통해 스캔한 문서나 사진에서 텍스트 정보를 쉽게 얻을 수 있습니다.CLOVA Chatbot: 자연어 처리(NLP) 기술을 바탕으로 사용자의 질문에 대답하거나 특정 작업을 수행하는 챗봇을 개발할 수 있는 플랫폼입니다.CLOVA Face: 얼굴 인식 기술을 이용한 서비스로, 얼굴 인식 및 분석을 통해 식별된 얼굴에서 성별, 나이, 감정, 표정 등 복잡하고 다양한 특징 정보를 제공합니다.CLOVA Speech: 사람의 음성 신호의 파형을 분석하여 사람의 음성을 텍스트로 변환하는 기술입니다.CLOVA Translation: 다국어 번역 서비스를 제공하여 텍스트나 음성을 다른 언어로 번역하는 기능을 지원합니다. 이를 통해 글로벌 커뮤니케이션을 쉽게 할 수 있습니다.이 외에도 CLOVA AI Service는 네이버의 강력한 인공지능 기술을 바탕으로 다양한 산업 분야에서 활용될 수 있으며, 사용자는 이를 통해 보다 편리하고 효율적인 서비스를 경험할 수 있습니다. 네이버는 지속적으로 CLOVA의 기능을 확장하고 개선하여 더 많은 사용자에게 최적의 AI 솔루션을 제공하고 있습니다.

whalee
0

CLOVA의 의의

 GPT 를 비롯해서 다양한 LLM Backbone 모델이 발전했지만, 한국어 데이터를 기반으로 만들어진 LLM 은 아직 개발되지 않았습니다.비록 CLOVA 도 한국어 LLM 모델이 아닌 Backbone 모델을 활용했지만, 한국에서 한국어 데이터를 사용했다는 점에서 의의가 있는 것 같습니다.CLOVA 는 한국 문화를 잘 이해하는 데이터를 기반으로 네이버와 연계하여 확장성, 연결성, 최적화를 잘 구현하고 있습니다. 그렇기에 한국에서 LLM 을 활용하는 데 있어서 CLOVA 는 좋은 선택지가 될 것 같습니다.한편, sLLM 의 대표격인 Llama 와 비교해서 한국어에 한해서는 우수성을 갖습니다. Llama 는 GPT 와 같은 거대 LLM 을 적은 파라미터로 finetuning 하여, 학교나 작은 기업에서 까지 연구에 활용할 수 있도록 기여한 연구 중 하나입니다. GPT 와 같은 거대 LLM 대비 적은 파라미터로 Inference 및 Training 을 할 수 있는 것입니다. 하지만 한국어 데이터는 극소수이기 때문에 한국에 잘 동작하지 못한다는 단점이 있고, 이에 비해 CLOVA 는 한국어 데이터를 활용했기 때문에 보다 한국어에 큰 강점을 가집니다.결론적으로 한국어, 특히 한국어를 활용하는 서비스에 있어서 CLOVA 는 매우 매력적인 선택지가 될 것 같습니다.

Brighteast
0

CLOVA OCR Service

기반 논문 CLOVA OCR Service는 AAAI 2022에 등재된 논문인 “BROS: A Pre-trained Language Model Focusing on Text and Layout for Better Key Information Extraction from Documents, Hong et al.(NAVER)”를 기반으로 하고 있다. BROS는 텍스트의 2D 공간 내 상대적 위치를 인코딩하고, 영역 마스킹을 통해 unlabeled document를 학습 데이터로 사용할 수 있으며, 잘못된 텍스트 순서로 인한 오류를 최소화 가능하고 few-shot 상황에서 기존 모델들보다 학습 효율이 높다. 주요 기능 및 특징다양한 입력 포맷 지원:이미지, PDF, 스캔된 문서 등 다양한 형식의 파일에서 텍스트를 인식할 수 있다.손글씨 인식 기능도 포함되어 있어, 다양한 상황에서 유용하게 활용될 수 있다.다국어 지원:한국어, 영어, 일본어, 중국어(간체, 번체) 등 여러 언어를 지원하여 국제적인 문서 처리에 용이하다.높은 인식 정확도:최신 딥러닝 기술을 적용하여 복잡한 배경이나 왜곡된 이미지에서도 높은 정확도로 텍스트를 인식할 수 있다.자동화된 문서 처리:문서를 자동으로 분류하고 템플릿에 따라 유사한 문서들을 처리하여 업무 흐름을 효율적으로 설계할 수 있다.인식 결과를 검증하는 기능도 포함되어 있어, 반복적인 검증 작업을 줄이고 신뢰성을 높일 수 있다.RESTful API 제공:다양한 서비스와 연계하여 사용할 수 있는 RESTful API를 제공하여 개발자들이 쉽게 통합할 수 있다.

노성래
0

프롬프트 작성 꿀팁

클로바 스튜디를 효과적으로 활용하기 위한 프롬프트 작성법에 대해 알아보겠습니다. 간단한 꿀팁과 예시를 통해 누구나 쉽게 이해하고 적용할 수 있도록 설명하겠습니다.1. 구체적이고 명확한 프롬프트 작성하기예시:나쁜 예시: "날씨 알려줘"  좋은 예시: "서울의 2024년 5월 30일 날씨를 알려줘"프롬프트는 가능한 한 구체적이고 명확하게 작성해야 합니다. 위 예시처럼 장소와 날짜를 명확히 제시하면 더 정확한 정보를 얻을 수 있습니다.2. 여러 단계를 포함한 프롬프트 사용하기예시:단순 프롬프트: "커피 만드는 법"  복합 프롬프트: "라떼를 만드는 법을 설명하고, 그에 필요한 재료 목록을 제공해줘"복합 프롬프트는 한 번에 여러 정보를 요청할 때 유용합니다. 이를 통해 필요한 모든 정보를 한 번에 얻을 수 있습니다.3. 질문의 맥락 제공하기예시:나쁜 예시: "좋은 책 추천해줘"  좋은 예시: "최근 베스트셀러 중에서 자기계발서를 추천해줘"프롬프트에 맥락을 제공하면 더 유용한 답변을 얻을 수 있습니다. 어떤 범주나 목적에 맞는지 구체적으로 언급하는 것이 좋습니다.4. 형식 지정하기예시:단순 프롬프트: "김치찌개 레시피"  형식 지정 프롬프트: "김치찌개 레시피를 단계별로 나눠서 알려줘"형식을 지정하면 정보를 더 체계적으로 얻을 수 있습니다. 단계별, 목록 형태 등으로 요청하면 이해하기 쉽습니다.5. 피드백 반영하기예시:처음 프롬프트: "나에게 책을 추천해줘"  피드백 반영 프롬프트: "지난번 추천한 책이 좋았어. 이번에는 조금 더 가벼운 소설을 추천해줘"이전 프롬프트의 결과를 바탕으로 피드백을 반영하면 더 맞춤형 답변을 얻을 수 있습니다.

hmm
0

CLOVA AI Services

네이버 CLOVA AI 서비스네이버의 CLOVA는 인공지능(AI) 기술을 활용하여 다양한 분야에서 혁신적인 솔루션을 제공하는 플랫폼입니다. CLOVA에서 제공하는 주요 AI 서비스와 그 특징에 대해 소개하고자 합니다.1. CLOVA SpeechCLOVA Speech는 고정밀 음성 인식 기능을 제공하며, 일반 음성과 전화 통화 음성에 최적화되어 있습니다. 이 서비스는 다양한 언어를 지원하며, 음성 명령 인식, 긴 비구조적 문장의 받아쓰기, 그리고 화자 인식을 통한 인증 기능 등을 포함합니다. 특히, 한국어와 일본어 음성 인식 기술은 세계 최고 수준을 자랑합니다​2. CLOVA OCR (Optical Character Recognition)CLOVA OCR은 인쇄된 텍스트와 이미지를 자동으로 추출하고 디지털화하여 문서 처리와 데이터 입력 자동화를 지원합니다. 이는 특히 문서 관리가 많은 업무 환경에서 큰 효율성을 제공합니다​ 3. CLOVA ChatbotCLOVA Chatbot은 고객 상호작용을 처리할 수 있는 정교한 챗봇을 생성합니다. 이 챗봇은 사용자 입력에 따라 자동으로 응답하고, 다양한 솔루션을 제공하여 고객 서비스의 질을 향상시킵니다​ 4. CLOVA DubbingCLOVA Dubbing은 AI를 활용하여 비디오에 음성을 자동으로 입히는 서비스입니다. 이는 미디어 제작과 콘텐츠 현지화에 특히 유용하며, 다양한 언어로 자연스러운 음성 더빙을 제공합니다​5. CLOVA StudioCLOVA Studio는 다양한 AI 모델을 생성하고 관리할 수 있는 도구를 제공합니다. 이 플랫폼은 AI 기반 애플리케이션 개발을 위한 종합적인 환경을 제공하여 개발자들이 손쉽게 AI 솔루션을 구축할 수 있도록 돕습니다​6. CLOVA VoiceCLOVA Voice는 텍스트를 자연스러운 음성으로 변환해주는 텍스트-음성 변환(TTS) 기능을 제공합니다. 이 서비스는 여러 언어를 지원하여 글로벌 시장에서도 활용도가 높습니다​7. CLOVA SentimentCLOVA Sentiment는 텍스트를 분석하여 그 감정을 파악하는 서비스입니다. 이는 시장 조사, 고객 피드백 분석, 소셜 미디어 모니터링 등에 유용하게 사용될 수 있습니다​ 8. HyperCLOVAHyperCLOVA는 GPT-3 아키텍처를 기반으로 한 대규모 AI 모델로, 한국어에 특화되어 있습니다. 이 모델은 대화형 AI, 콘텐츠 생성 등 다양한 응용 프로그램을 지원하며, 고품질의 텍스트 생성 능력을 제공합니다​ 

서승원
0

CLOVA Studio 예시 - 네이버 쇼핑

네이버 쇼핑몰 AI 기반 상품 추천 기술네이버는 AI 기반 상품 추천 기술을 고도화하여 검색 결과에 2가지 쇼핑 블록을 제공한다.이용자 쇼핑 이력을 분석해 개인화된 검색 결과를 제공하는 ‘맞춤형 블록’과 추가로 탐색할 만한 쇼핑 관심사를 연결하는 ‘추천형 블록’이다. 맞춤형 블록찜해놓은 상품이거나 이미 구매한 상품과 매치하여 비슷한 상품을 찾아준다.최근에 테이블을 찾아봤다면 그 테이블과 비슷한 제품을 추천하고 또한 클릭한 테이블과 연관있는 다이닝 체어 상품까지 보여주며,사용자 이력을 분석하여 기존보다 더욱 확장된 추천 경험을 검색 결과에서 제공한다.맞춤형 블록에서는 검색 질의와 쇼핑 이력 간의 연관성을 폭넓게 분석하기 위해 검색 질의의 의미적인 확장성을 고려하고 있다.여기서 하이퍼클로바를 사용하는데, 이를 통해 검색 질의와 의미적으로 비슷한 쇼핑 이력까지 찾아내어 더 많은 사용자에게 맞춤형 블록 결과를 제공한다.  추천형 블록추천형 블록은 검색어와 연관된 쇼핑 관심사를 추천해서 다양한 상품을 둘러볼 수 있도록 한다.여기서 사용자의 검색 의도가 되는 쇼핑 관심사를 자동으로 생성하기 위해 하이퍼클로바 기술을 사용한다.하이퍼 클로바를 통해 주요 쇼핑 키워드 4.5만개의 관계를 유추하여 그룹핑하고, 그룹핑 된 키워드들을 포괄하여 표현할 수 있는 약250 여개의 쇼핑 관심사를 자동으로 생성한다. 상품-검색어-관심사가 매칭된 쇼핑 그래프를 통해, 단순히 하나의 검색어, 하나의 상품 클릭에대한 추천 뿐만 아니라, 사용자가 지속적으로 찾게 될 관심사를 예측하여 폭넓게 상품을 추천할 수 있다.   https://blog.naver.com/PostView.naver?blogId=naver_search&logNo=223171055156&parentCategoryNo=&categoryNo=44&viewDate=&isShowPopularPosts=false&from=postViewhttps://blog.naver.com/naver_search/223185243696 

정홍주
0

CLOVA Studio를 활용한 예시 - 소설 창작

CLOVA Studio 는 대규모 언어 모델 과제를 수행할 수 있는 공간입니다.이를 기반으로 출시된 서비스 중 대표적인 예시로 “하이퍼클로바로 소설 쓰기”라는 사례를 소개하고자 합니다. 하이퍼클로바 언어 모델에 “시계”와 “아이스크림”과 같은 서로 어울릴 것 같지 않은 단어들로 감성적인 문장을 만들어달라고 요청했을 때 아래와 같이 제시된 단어의 속성을 스스로 고려하여 감성적인 문장을 잘 만들어 내는 것을 확인 할 수 있습니다. 또한 아래 사진과 같이 비유와 상징의 시적 표현을 사용하는 것 뿐만 아니라 문체를 바꾸거나 “냉소적”, “비관적”이라는 다른 키워드를 요청했을 때, 그에 맞는 문장을 생성해 주는 것도 하이퍼클로바 언어 모델의 특징입니다. 그동안 많은 곳에서 하이퍼스케일 AI를 공개하였지만, 그 중에서도 엄청난 양의 한국어 데이터를 학습한 하이퍼클로바 언어 모델이 아마 한국어를 가장 잘 이해하는 AI일 것이라고 예상합니다. 기존에 AI를 개발하려면 데이터를 확보하고, 모델을 구현하기 위한 전문성을 가진 개발자의 리소스가 필요했으며, 이에 필요한 시간과 비용이 상당히 요구되었습니다. 그러나 클로바 스튜디오에서는 단 몇 줄의 지시문과 예제를 입력하는 것만으로도 개발에 대한 지식 없이 AI를 만들 수 있는 툴입니다. 이러한 점에 집중하여 클로바 스튜디오를 활용해 소설을 작성한 예시가 존재합니다.소설을 써본 적 없는 수준의 담당자가 직접 현대 판타지물 연재작과 공포물 단편집을 완성하였으며, 네이버 웹소설의 UGC 코너에 연재한 사례입니다. 현재 하이퍼클로바 기본 모델은 여러 문학적 장치들에 특화되어 학습되어 있는 상태는 아니기 때문에, 사람이 구상하던 스토리의 전개 흐름을 프롬프트로 제시하였을 때 언어 모델이 생성한 결과들을 사람이 선별하여 문장을 묶어내는 방식으로 작업되었습니다. 즉, 언어 모델의 문장력을 활용하여 매끄럽게 소설을 만드는 것에 집중하였다고 볼 수 있습니다. ‘서지루, 천재 라이터 되다!’ 소설의 경우 전체 9회 분량의 11,845자에서 하이퍼클로바의 문장은 약 6,354자로 약 50% 가량 사용되었으며, 사람과 AI가 서로 교차하며 협업하고 있는 형상을 띄고 있습니다. 출처: https://engineering.clova.ai/posts/2022/08/hyperclova-novel-part-1

wkejrd
0

RAG ?

LLM의 등장과 한계대규모 언어 모델(LLM)의 등장은 인간만이 가능하다고 여겨졌던 많은 분야에서 인공지능의 잠재력을 보여주었습니다. 방대한 양의 데이터를 기반으로 학습한 LLM은 인간 수준의 텍스트를 생성하고, 다양한 질문에 답변을 제공하며, 나아가 창의성이 요구되는 예술 분야에서도 두각을 나타내고 있습니다.그러나 LLM이 보편화된 지 약 2년이 지난 지금, 이를 상용화하려는 많은 기업은 오랜 문제에 직면하고 있습니다. 그 문제는 바로 '할루시네이션'입니다. 인공지능 챗봇과의 대화에 큰 기대를 품었던 사용자들은 LLM이 제공하는 부정확하고 불완전한 답변에 실망하곤 합니다. 이는 할루시네이션 문제와 밀접한 관련이 있습니다. 할루시네이션은 단순히 사실이 아닌 내용을 만들어내는 문제를 넘어, LLM이 데이터의 최신성이나 출처의 투명성 확보와 같은 '정보 검색 방식의 질적 전환'에 필수적인 기능을 갖추지 못했음을 시사합니다. 아무리 그럴듯해 보여도 실제로는 도움이 되지 않는 답변으로는 기존의 정보 검색 패러다임을 변화시킬 수 없을 것입니다.*할루시네이션: 편향되거나 불충분한 학습 데이터, 모델의 과적합 등으로 인해 LLM이 부정확한 정보를 생성하는 현상 LLM의 한계를 뛰어넘는 방법: RAG이러한 LLM의 한계를 극복하기 위해 여러 방법이 제안되고 있습니다. 그중 하나는 Fine tuning으로, 사전 학습 모델(pre-trained model)에 특정 도메인(예: 의료, 법률, 금융)의 데이터를 추가 학습시켜 모델을 최적화하는 방식입니다. 이를 통해 모델은 특정 분야에 대한 전문 지식을 습득하고 정확하고 전문적인 답변을 제공할 수 있습니다. 그러나 Fine tuning은 시간과 비용이 많이 소요되고, 모델의 범용성이 저하될 수 있습니다.반면 RAG는 외부 지식 소스와 연계하여 모델의 범용성과 적응력을 유지하면서도 정확하고 신뢰할 수 있는 답변을 생성할 수 있습니다. 즉, RAG는 LLM의 한계를 극복하면서도 그 장점을 살릴 수 있는 접근 방식이라고 할 수 있습니다.RAG의 작동 방식은 다음과 같습니다.사용자가 질문을 입력합니다.RAG는 외부 데이터베이스(예: 웹 문서, 기업 내부 문서)에서 질문과 관련된 정보를 검색합니다.검색된 정보를 기반으로 LLM이 답변을 생성합니다. RAG는 다음과 같은 장점을 가지고 있습니다.Fine tuning에 비해 시간과 비용이 적게 소요됩니다.외부 데이터베이스를 활용하기 때문에 별도의 학습 데이터를 준비할 필요가 없습니다.모델의 일반성을 유지할 수 있습니다.특정 도메인에 국한되지 않고 다양한 분야에 대한 질문에 답변할 수 있습니다.답변의 근거를 제시할 수 있습니다.답변과 함께 정보 출처를 제공하여 답변의 신뢰도를 높일 수 있습니다.할루시네이션 가능성을 줄일 수 있습니다.외부 데이터를 기반으로 답변을 생성하기 때문에 모델 자체의 편향이나 오류를 줄일 수 있습니다. 이를 비유하자면, Fine tuning은 언어 모델(A)이 사용자의 질문에 정확히 답하기 위해 특정 도메인 지식을 공부하고 학습하여 암기한 상태로 성장시키는 것이라면, RAG는 언어 모델(A)과 도서관 사서가 협업하는 것과 같습니다. 사용자가 질문을 하면, 사서가 도서관의 책 중에서 그 질문에 대한 정보를 담고 있는 책을 찾아낸 후, 언어 모델(A)이 그 책의 내용을 참고하여 질문에 답변하는 것이라고 볼 수 있습니다.Fine tuning과 RAG는 기술적 차이는 있지만, 모두 LLM의 한계를 극복하고 인공지능 기술의 발전을 이끄는 중요한 방법입니다. 상황에 따라 적합한 방법을 선택하고 활용한다면 LLM의 잠재력을 최대한 발휘할 수 있을 것입니다.

Haewon
0

이미지 검색 서비스 입문

서비스 개요: 이미지 검색 서비스는 사용자가 업로드한 이미지와 유사한 이미지를 찾아주는 기능입니다. 클로바 클라우드의 이미지 인식 기술을 활용하여 입력된 이미지를 분석하고, 유사한 이미지를 검색합니다.구현 방법:서비스 설정: 클로바 클라우드 콘솔에서 이미지 인식 API 활성화 및 API 키 발급.이미지 업로드 및 분석: 사용자가 업로드한 이미지를 클로바 클라우드 API에 전송하여 분석.유사 이미지 검색: 분석된 이미지를 바탕으로 유사한 이미지를 데이터베이스에서 검색하여 결과 반환.

홍씨
0

클로바 스튜디오의 이미지 인식 서비스 사례

네이버 클로바 클라우드 및 스튜디오를 활용한 이미지 인식 서비스의 구체적인 사례는 다음과 같다.1.이미지 검색 서비스이미지 검색 서비스는 사용자가 입력한 이미지와 유사한 이미지를 검색하는 서비스이다.클로바 클라우드의 이미지 인식 기술을 활용하여 사용자가 입력한 이미지를 분석하고, 유사한 이미지를 검색한다.사용자는 검색 결과를 통해 원하는 이미지를 쉽게 찾을 수 있다.2.이미지 분석 서비스이미지 분석 서비스는 이미지를 분석하여 다양한 정보를 추출하는 서비스이다.클로바 클라우드의 이미지 인식 기술을 활용하여 이미지의 색상, 형태, 객체 등을 분석하고, 이를 바탕으로 다양한 정보를 추출한다.예를 들어, 이미지 분석 서비스를 이용하여 상품 이미지를 분석하고, 상품의 종류, 가격, 색상 등을 추출할 수 있다.3.이미지 보안 서비스이미지 보안 서비스는 이미지의 보안을 강화하는 서비스이다.클로바 클라우드의 이미지 인식 기술을 활용하여 이미지의 불법 복제나 유출을 방지한다.예를 들어, 이미지 보안 서비스를 이용하여 회사 내부의 이미지를 보호하고, 불법적인 유출을 방지할 수 있다.4.이미지 추천 서비스이미지 추천 서비스는 사용자의 취향에 맞는 이미지를 추천하는 서비스이다.클로바 클라우드의 이미지 인식 기술을 활용하여 사용자의 취향을 파악하고, 이를 바탕으로 사용자에게 적합한 이미지를 추천한다.예를 들어, 이미지 추천 서비스를 이용하여 사용자의 취향에 맞는 여행지의 이미지를 추천할 수 있다.5.이미지 번역 서비스이미지 번역 서비스는 이미지에 있는 외국어를 번역하는 서비스이다.클로바 클라우드의 이미지 인식 기술을 활용하여 이미지에 있는 외국어를 인식하고, 이를 번역한다.예를 들어, 이미지 번역 서비스를 이용하여 외국어로 된 메뉴판을 번역할 수 있다.위와 같은 이미지 인식 서비스는 다양한 분야에서 활용될 수 있으며, 사용자에게 편리한 서비스를 제공할 수 있다.

augi_kky
0

HyperCLOVA X의 장점과 프롬프트 가이드

HyperCLOVA X의 장점 HyperCLOVA X는 AI 백본 모델, 데이터, 튜닝 기술, 슈퍼 컴퓨팅 인프라와 이 모든 것에 대한 노하우로 만들어집니다. HyperCLOVA의 업그레이드 모델인 HyperCLOVA X는 LLM의 한계인 사실 왜곡(hallucination), 시의성 정보 취약, 수식 연산&계산 취약, 정의하지 않은 정보 제공, 이미지 생성&해석의 어려움을 보완하여 더욱 놀라운 성능과 향상된 품질을 제공합니다.  * LLM (Large Language Model): 대용량의 텍스트 데이터를 학습시켜 성능을 극대화한 언어 모델. 주어진 문장에서 다음 단어를 맞출 수 있도록 학습시킴 HyperCLOVA X는 최근 가장 주목받는 ChatGPT에 비해서도 한국어 데이터를 6,500배 더 학습하였습니다. 이는 여태까지 한국 서비스 이용자들과 함께 한 경험이 있어서 가능한 일이었는데요, 네이버 뉴스와 블로그 등의 데이터를 통해 자연스러운 한국어 표현은 물론이고 한국 사회의 법, 제도, 문화적 맥락까지 이해해서 소통하는 능력을 가지고 있습니다.다양한 업무를 처리해 주는 ‘제네럴리스트’가 필요할 때도 있지만, 해야 할 일이 정해졌다면 그 일에 특화된 ‘스페셜리스트’가 필요합니다. 바로 이 지점에 주목한 HyperCLOVA X는 각자 분야에서 열심히 일하고 있는 ‘우리’의 필요에 따라 커스터마이징이 가능합니다. 각 산업 군에서 필요로 하는 데이터들을 활용해 HyperCLOVA X를 원하는 방향으로 튜닝할 수 있는데요, 일하는 분야에 따라 ‘HyperCLOVA X 고객 응대’, ‘HyperCLOVA X 코딩’, ‘HyperCLOVA X 가전’ 등 무궁무진하게 다양해질 수 있다는 점이 또 하나의 특별한 매력입니다. 하이퍼클로바와 클로바 스튜디오는 무엇이 다를까?다재다능한 초대규모 AI 모델 하이퍼클로바! 하지만 개발자가 아닌 일반인들은 이를 어떻게 활용해야 할지 막막할 수 있습니다. 클로바 스튜디오는 하이퍼클로바를 활용하여 사용자가 입력한 내용에 따라 AI 기술을 통해 생성된 문구를 출력하는 서비스로, 개발 관련 전문 지식이 없어도 자유롭게 AI를 탐색하고 실행할 수 있습니다.문장 생성, 요약, 분류, 대화, 문장 변환 등 언어에 관한 능력이 필요하다면, 클로바 스튜디오를 활용해보는 것을 추천드려요. 출처 : https://channeltech.naver.com/contentDetail/21 HyperCLOVA X의 프롬프트 가이드 1. 프롬프트의 예제를 다양하게 구성하세요.프롬프트의 유형은 크게 세 가지가 있습니다. 예제를 구성하지않고 요청하는 zero-shot 프롬프트,하나의 예제로 구성하는 one-shot 프롬프트, 여러 개의 예제로 구성하는 few-shot 프롬프트가 있습니다.우리는 이것을 In-context learning이라고 부릅니다.적절한 예제의 개수는 작업에 따라 달라질 수 있으며, 모델이 잘 이해하는 작업의 경우 3~4개의 예제만 넣어도 잘 수행합니다. 프롬프트에 예제를 몇 개나 넣어야 하는지 궁금해하시는 분들이 많이 계시는데요.▼ 예제는 무조건 많이 넣어주기보다는 모델이 다양한 케이스에 대한 패턴을 파악할 수 있도록 구성하는 것이 효과적입니다.원하는 결과가 나오지 않을 때는 예제를 다시 점검해보고 모델에게 정확히 가르쳐주세요. 2. 모델이 출력할 항목을 정확히 지정하세요.모델이 출력할 결과에 대한 항목을 정확히 지정하는 것이 도움이 될 수 있습니다.▼ 예를 들어, [항목:] 또는 {검정 분류}와 같은 형식을 말합니다.이 방법은 튜닝을 위해서 데이터셋 구축하는 데에도 유용하게 쓰일 수 있습니다. 3. 컨텍스트 정보를 활용해보세요.계절감▼ 계절감 있는 출력결과가 나오게 하고 싶으면, 예제에 날짜나 시즌 어휘를 추가해주세요.초대규모 언어모델은 학습된 날짜까지만 답을 할 수 있으며, 오늘 날짜와 현재 시간은 어떤지 현실 세계와의 연결이 되어있지 않습니다.시간축을 넣는 것으로 모델에게 시간에 대한 힌트를 줄 수 있습니다.단, 시즌, 계절감 처럼 넓은 범위의 기간 형태로 쓰일 수 있을 것이며, 정확한 시간을 기준으로 연산에는 부정확할 수 있습니다. 대상자 지정▼ 대상자를 지정해두는 것이 좋을 수도 있습니다. 대상자를 넣어줌으로써 대상자를 정확히 인식하면서 문장의 목적을 구체화 시키는 것이죠.이외에도 컨텍스트 정보는 다양하게 활용할 수 있습니다. 4. 지시문을 넣어주세요.▼ 프롬프트 앞에 명료하게 지시문을 적어주면 작업의 성능이 향상될 수 있습니다.▼ 지시문은 최대한 쉽게 풀어서 단순하고 명료하게 작성해 주세요.▼ 그리고 지시문을 쓸 때 예제 항목에 쓰인 단어를 함께 넣어서 연관성을 높여보세요.지시문과 항목의 관계성을 높이는 것이죠.단, 지시문은 복잡한 조건을 보장하지 않기 때문에, 여러 개의 복잡한 조건을 거는 것은 효과적이지 않을 수 있습니다.  5. 지시문에는 부정문보다 긍정문을 사용해주세요.부정문보다는 긍정문을 사용해보세요.“정중하지 않게 쓰지 않습니다.”보다는 “정중하게 씁니다”,“길지 않게 설명합니다.”보다는 “짧게 설명합니다.”와 같이 최대한 풀어서 설명해서 명료해지는 것이죠.언어모델은 기본적으로 생성해 내려는 특성이 있다보니, ‘~하지 마세요’처럼 제한을 거는 것 보다는,긍정적인 방향으로 허용하는 형태가 나을 수 있습니다.  6. 지시문과 예제를 섞어보세요지시문이랑 예제를 어우러질 수 있도록 하는 것이 효과적일 수 있습니다.예제를 나열하면서 시퀀적인 패턴으로 인식하게 하는 것보다는 독립적인 구성이 될 수 있도록 하는 것이죠.  7. 단조로운 예제를 바꾸어보세요.예제가 단조로우면, 실행 결과도 단조로울 수 있습니다.이때는 Temperature를 아무리 높여도, 문장의 창의성이 더해지지는 않아요.▼ 상품 큐레이션에 사용할 수 있을만한 감도 깊은 광고 카피들로 구성하면, 언어 모델이 생성하는 결과의 품질이 달라집니다.  8. 키워드로 모델에 변수를 부여해보세요.‘키워드’에 어떤 분위기나, 단어를 지시함으로써, 더욱 원하는 느낌의 결과가 나오게 할 수 있습니다.이런 방법을 가지고, 모델을 통제하고 제어할 수 있기도 합니다.이때 키워드는 아무 키워드나 쓰지 않고, 키워드와 문구를 어느정도 매핑시키는 형태로 예제를 구성하는 것이 좋습니다.  9. 낯설게, 불편하게 조합해보세요.어울릴 거 같지 않은 두 단어를 조합해 보세요. 새로운 조합을 통해 참신하고 주목도가 높은 문장이 만들어질 수 있습니다. AI는 기계적인 학습을 통해 언어를 이해하고 생성하기 때문에, 사람처럼 감정을 직접 체험하거나 경험할 수는 없습니다.하지만 한국어에 특화된 하이퍼클로바 언어모델은 언어 데이터에서 아주 섬세한 감성적인 뉘앙스를 파악하고,단어와 단어 상의 관계성이나, 문맥, 어조를 고려해서, 문장을 만들어 낸다는 특징이자 강점이 있습니다.하이퍼클로바 언어 모델은 이러한 부분에서 여타 AI에 비해 전혀 밀리지 않고 있습니다. 출처 : https://www.ncloud-forums.com/topic/93/

김형우
0

CLOVA Studio의 임베딩 기능과 활용 방안

안녕하세요,이번에는 네이버의 생성형 AI 개발 도구인 CLOVA Studio의 임베딩 기능과 활용 방안에 대해 알아보려고 합니다.임베딩 기능 소개:임베딩은 텍스트를 수치 벡터로 변환하는 과정을 의미합니다. 이를 통해 텍스트 데이터를 AI 모델에 입력할 수 있게 되어 다양한 자연어 처리 작업을 수행할 수 있습니다. CLOVA Studio에서는 이러한 임베딩 기능을 API를 통해 제공하고 있습니다.활용 방안:자연어 처리 작업: 임베딩된 텍스트를 활용하여 자연어 처리 작업을 수행할 수 있습니다. 예를 들어, 텍스트 분류, 감성 분석, 문서 유사도 측정 등의 작업에 활용할 수 있습니다.추천 시스템: 사용자의 텍스트 입력을 임베딩하여 사용자의 취향이나 특성을 파악하고, 이를 기반으로 상품이나 콘텐츠를 추천하는 추천 시스템에 활용할 수 있습니다.텍스트 생성: 임베딩된 텍스트를 기반으로 AI 모델을 훈련시켜 다양한 텍스트를 생성할 수 있습니다. 이를 활용하여 자동 글쓰기, 번역, 대화 시스템 등을 구현할 수 있습니다.문서 요약: 임베딩된 텍스트를 이용하여 문서의 핵심 내용을 추출하고 요약하는 문서 요약 시스템을 구현할 수 있습니다.API 문서: CLOVA Studio의 임베딩 기능에 대한 자세한 내용은 API 문서를 참고하시기 바랍니다.이렇게 CLOVA Studio의 임베딩 기능을 활용하여 다양한 자연어 처리 및 텍스트 분석 작업을 수행할 수 있습니다.

JJuOn
0

CLOVA studio Object Storage 소개

Object Storage는 데이터 관리와 보안을 향상시키는 다양한 기능을 제공한다.데이터 무결성 및 복원력을 강화하기 위해 HTTPS 암호화, 다단계 보안 장비, 데이터 유실 방지 시스템을 구현초대용량 데이터 저장이 가능하여 GB에서 PB 단위까지 저장 공간을 확장 가능협업의 민첩성과 유연성을 증대외부 도구와의 호환성도 제공(RESTful API를 통해 Amazon S3와 호환되는 도구로 스토리지 관리 이용 요금유의사항 : Object Storage는 유료 서비스로, 이용 요금은 데이터 저장량, API 요청 수, 네트워크 전송 요금을 합산해 부과됨데이터 저장량 요금: Object Storage에 저장된 데이터 저장량과 저장 시간에 따라 요금 부과API 요청 수 요금: Object Storage를 사용하기 위한 API 요청 건에 따라 요금 부과네트워크 전송 요금: 인터넷을 이용한 아웃바운드 전송 요금 부과. VPC 환경에서는 사설 도메인 이용 시 별도 요금 발생 이용 신청 방법Services > Storage > Object Storage 메뉴 클릭이용 신청 후 적용 버킷 사용 방법첫 문자와 끝 문자는 알파벳 소문자 또는 숫자만 허용하며, 3자~ 63자 이내로 입력마침표(.)와 하이픈(-)은 허용되지만, IP 주소 형태의 이름은 허용하지 않음버킷 생성 후에는 이름을 변경할 수 없음. 버킷 이름은 객체 도메인 생성 시 활용됨리전 내에 동일한 버킷 이름이 있을 경우 등록되지 않음. 등록할 버킷의 고유한 이름 입력 파일 사용 방법파일/폴더 관리는 파일 편집에서 가능유의사항 : [권한 및 메타 데이터 설정] 버튼 > [공개 및 권한 관리] 탭 > 모두에게 공개하기 설정 시 요금이 과도하게 부과될 수 있으니, 파일 공개가 반드시 필요할 경우에만 설정   암호화 설정(KMS)버킷의 암호화를 설정하면 네이버 클라우드 플랫폼의 Key Management Service와 연동하여 버킷에 대한 접근을 제어하고 저장된 객체를 보호할 수 있음 암호화를 한번 설정한 후에는 해제할 수 없으며, 암호화를 설정하면 다음의 기능을 사용할 수 없음잠금 설정정적 웹 사이트 호스팅공개 여부 설정타 계정 권한 부여수명 주기 정책(Lifecycle Management) 설정 수명 주기 정책 사용 (암호화 설정(KMS)이 적용된 버킷에는 수명 주기 정책을 적용할 수 없음)활용도가 높은 데이터는 입출력 속도가 빠른 Object Storage에 저장하고 규제 대응과 향후 분석을 위해 장기간 저장이 필요한 데이터를 Archive Storage에 이관하면,  총 소유 비용(Total cost of ownership, TCO)을 절감하고 데이터를 체계적으로 관리 가능Lifecycle Management 선택 후 수명 주기 정책 추가 클릭정책 선택: 정책의 유형 선택만료 삭제: 일정 기간이 지나면 객체 삭제이관: 일정 기간이 지나면 객체를 Archive Storage에 저장(원본은 Object Storage에 유지)이관 후 삭제: 일정 기간이 지나면 객체를 Archive Storage에 저장하고, 원본은 Object Storage에서 삭제유의사항이관 대상의 파일명이 215 Bytes 이상이면 Archive Storage로 이관되지 않음이관 대상의 파일명에 슬래시(/)가 중복되어 있으면 Archive Storage로 이관되지 않음SSE-C를 설정한 객체는 Archive Storage 이관 기능을 사용할 수 없음객체 잠금(WORM) 버킷은 이관할 수 없음 상세 모니터링 정책 사용버킷에 상세 모니터링 정책을 적용하면 대상 버킷에 대한 API 요청 관련 지표가 수집되며, 수집된 지표는 Cloud Insight에서 확인 가능접두사와 접미사 설정을 통해 지표 집계 대상을 제한할 수 있음 https://guide.ncloud-docs.com/docs/storage-storage-6-1  

jude123
0

Clova Studio를 이용한 Fine Tuning

본 글은 다음 링크의 가이드 내용을 바탕으로 작성되었습니다 : https://clovastudio.ncloud.com/tuning/api 학습된 ClovaStudio 모델을 이용하여 원하는 서비스를 만들고자 하는 경우, 모델을 그대로 사용하는 것보다 서비스의 목적에 맞게 튜닝하여 사용하는 과정이 필수적입니다. 이와 관련하여, Clova Studio에서는 모델 튜닝에 대한 가이드를 제공하고 있습니다. 본 토론글에서는 사용자가 여행을 계획하는 지역과 예산, 취향 등을 입력하면, 이를 토대로 여행 계획을 제공하는 예시를 들어 설명하고자 합니다.우선. 데이터셋을 만들어야 합니다. 데이터셋은 single turn, multi turn으로 나뉘어집니다.Single turn은 사용자의 입력 문장에 대해 하나의 답변을 받고 마무리하는 경우를 의미하고, multi turn은 사용자의 입력에 대해 모델이 출력 문장을 리턴하고, 이에 대해 사용자가 다시 입력하며 대화가 이루어지는 경우를 의미합니다. 여기에서는, 편의를 위해 single turn을 사용하는 경우를 기준으로 하겠습니다.Single turn의 경우 데이터셋의 예시는 사진과 같습니다. 여행 계획을 생성하는 본 예시에 적용하면, 다음과 같은 데이터셋을 생성할 수 있겠습니다.C_ID: 대화 ID, 각 데이터 포인트에 고유한 ID를 부여하여 관리합니다.T_ID: 턴 ID, 싱글턴에서는 항상 0으로 설정합니다.Text: 사용자의 입력, 예를 들어 "서울에서 주말 여행 계획 세워주세요."Completion: 서울 주말 여행 계획: 1일차:   - 오전: 광화문 광장 방문 후 경복궁 관람  - 오후: 인사동 쇼핑 거리 탐방 및 전통 찻집 방문  - 저녁: 한강 공원에서 피크닉 2일차:  - 오전: 북촌 한옥 마을 및 삼청동 거리 산책  - 오후: 남산 타워 전망대 방문  - 저녁: 명동에서 쇼핑 및 길거리 음식 체험  추가로, 다음의 주의사항들이 존재합니다. 데이터셋은 .csv 또는 .jsonl 형식으로 제공되며, UTF-8 인코딩을 준수해야 합니다.각 행은 최대 4,000자 이내로 구성해야 하며, 그 이상일 경우 데이터셋이 올바르게 처리되지 않을 수 있습니다.텍스트(Text)는 사용자의 질문을, 완성(Completion)은 AI의 응답을 나타내야 합니다.개인정보가 포함된 데이터셋의 사용은 사용자의 책임하에 이루어지며, 관련 문제 발생 시 모든 책임은 사용자에게 있습니다.이와 같이 데이터셋을 준비하고 모델을 튜닝하는 과정을 통해, 사용자의 요구에 맞는 개인화된 AI 기반 여행 계획 서비스를 제공할 수 있습니다. 이를 통해 사용자는 보다 편리하고 맞춤화된 서비스를 경험할 수 있으며, 서비스 제공자는 사용자 만족도를 높이는 데 기여할 수 있습니다.

HealingMusic
0