CWN(CHANGE WITH NEWS) - 마이크로소프트, ML.NET 2.0 배포...텍스트 분류 기능 강화

  • 맑음김해시21.3℃
  • 맑음보령18.4℃
  • 구름조금밀양19.8℃
  • 맑음광주20.6℃
  • 구름많음홍천17.0℃
  • 구름많음영천19.5℃
  • 맑음문경17.3℃
  • 구름많음강릉20.5℃
  • 구름조금태백13.5℃
  • 맑음임실16.2℃
  • 맑음양산시20.8℃
  • 구름조금상주17.8℃
  • 맑음북부산19.8℃
  • 구름조금장흥16.6℃
  • 맑음부여18.0℃
  • 구름많음원주17.7℃
  • 구름많음강진군18.4℃
  • 박무백령도19.2℃
  • 구름많음안동17.3℃
  • 구름많음제천16.0℃
  • 구름조금울산20.3℃
  • 구름많음제주21.5℃
  • 구름많음천안16.8℃
  • 구름많음광양시20.3℃
  • 구름많음함양군17.6℃
  • 맑음금산16.8℃
  • 구름많음순천15.3℃
  • 구름조금전주20.8℃
  • 맑음동두천17.1℃
  • 구름조금여수21.3℃
  • 구름많음영주15.8℃
  • 구름많음고흥16.6℃
  • 구름조금성산19.5℃
  • 구름많음정선군15.9℃
  • 맑음서산17.4℃
  • 구름많음의성18.0℃
  • 맑음강화18.3℃
  • 구름많음거창16.5℃
  • 맑음군산18.6℃
  • 구름조금서청주16.2℃
  • 구름조금인제15.6℃
  • 맑음고창17.6℃
  • 구름많음청송군16.8℃
  • 구름조금남원17.4℃
  • 흐림울릉도20.1℃
  • 구름많음창원20.7℃
  • 맑음인천20.0℃
  • 맑음거제19.3℃
  • 구름조금속초18.2℃
  • 구름조금진도군18.0℃
  • 구름많음산청18.4℃
  • 구름많음구미18.9℃
  • 맑음부안18.2℃
  • 구름많음영월16.4℃
  • 구름많음울진18.5℃
  • 맑음고창군17.6℃
  • 구름많음대구21.2℃
  • 구름많음합천20.4℃
  • 구름많음진주17.6℃
  • 맑음부산22.1℃
  • 맑음북춘천16.6℃
  • 흐림포항21.7℃
  • 구름많음대관령13.1℃
  • 맑음순창군17.6℃
  • 맑음정읍18.3℃
  • 구름조금고산21.3℃
  • 구름조금세종17.6℃
  • 구름조금북창원21.4℃
  • 맑음목포21.0℃
  • 맑음철원16.6℃
  • 박무서울19.8℃
  • 구름많음봉화14.9℃
  • 구름많음영덕18.5℃
  • 맑음양평17.9℃
  • 구름조금보은16.0℃
  • 구름조금의령군17.9℃
  • 맑음장수14.4℃
  • 맑음파주16.6℃
  • 맑음홍성17.2℃
  • 구름조금춘천16.7℃
  • 구름많음통영20.4℃
  • 맑음영광군18.3℃
  • 구름많음충주17.2℃
  • 맑음대전18.3℃
  • 구름많음경주시18.7℃
  • 구름조금추풍령16.6℃
  • 맑음이천17.5℃
  • 구름많음북강릉18.2℃
  • 맑음흑산도20.7℃
  • 맑음해남17.3℃
  • 맑음남해19.6℃
  • 구름조금서귀포22.7℃
  • 박무수원17.7℃
  • 구름조금보성군18.2℃
  • 맑음청주20.1℃
  • 구름많음동해18.6℃
  • 맑음완도20.6℃
  • 2025.09.30 (화)

마이크로소프트, ML.NET 2.0 배포...텍스트 분류 기능 강화

최정인 / 기사승인 : 2022-11-29 09:47:00
  • -
  • +
  • 인쇄

해외 IT 매체 인포월드가 마이크로소프트의 오픈소스 크로스 플랫폼 머신러닝 .NET 프레임워크 인 ML.NET 2.0 배포 소식을 보도했다. ML.NET 2.0은 텍스트 분류와 자동 머신러닝 기능을 개선했다.

ML.NET 2.0은 11월 10일 자로 ML.NET 모델 작성기(ML.NET Model Builder)의 신규 버전과 함께 공개됐다. ML.NET 모델 작성기는 머신러닝 모델을 구축하는 시각적 개발 도구이다. 모델 작성기의 텍스트 분류 시나리오는 ML.NET 텍스트 분류 응용 프로그램 인터페이스(ML.NET Text Classification API)를 기반으로 한다.

지난 6월 자로 프리뷰 과정을 거친 텍스트 분류 API(Text Classification API)는 개발자가 원시 텍스트 데이터를 분류하기 위한 사용자 지정 모델을 학습하는 기능을 지원한다. 텍스트 분류 API는 마이크로소프트 리서치(Microsoft Research)가 개발한 사전 학습 토치샤프 NAS-BERT 모델(TorchSharp NAS-BERT model)과 개발자가 소유한 자료를 이용해 모델을 미세 조정한다. 모델 작성기 시나리오는 중앙처리장치(CPU)나 쿠다(CUDA) 호환 그래픽 처리 장치(GPU)에서 로컬 학습을 지원한다.

이진 분류(binary classification), 다중 분류(multiclass classification)와 회귀 모델 학습에서 사전 학습된 자동 기계학습 파이프라인을 이용할 수 있어, 머신러닝을 더욱 쉽게 시작할 수 있다.

오토ML 피처라이저(AutoML Featurizer)를 이용해 데이터 전처리 과정 자동화도 지원한다. 아울러, 개발자는 학습 과정에서 사용할 트레이너를 선택할 수 있다. 최적 하이퍼 매개 변수를 찾는 데 사용할 조정 알고리즘도 선택할 수 있다.

고급 자동 오토ML 훈련 옵션도 추가돼, 트레이너와 최적화용 평가 지표도 선택할 수 있다. 또한, 토치샤프 NAS-BERT 모델을 기반으로 하는 문장 유사도 API는 두 개 어구의 유사도를 대변하는 값을 산출한다.

이 밖에 ML.NET 개발진은 앞으로 딥러닝 기능을 강화하고 회귀나 분류 등 기존 머신러닝 작업에 LightGBM 프레임워크 사용을 확대할 예정이라고 밝혔다. 개발진은 오토ML API 개선에도 참여하여 새로운 시나리오와 사용자 정의를 지원하고 머신러닝 작업 흐름을 단순화한다.

[저작권자ⓒ CWN(CHANGE WITH NEWS). 무단전재-재배포 금지]

최신기사

뉴스댓글 >

- 띄어 쓰기를 포함하여 250자 이내로 써주세요.
- 건전한 토론문화를 위해, 타인에게 불쾌감을 주는 욕설/비방/허위/명예훼손/도배 등의 댓글은 표시가 제한됩니다.

댓글 0

Today

Hot Issue