• 제목/요약/키워드: Processing Process

검색결과 10,877건 처리시간 0.035초

아산 시전리 유적 출토 옥기(천하석)의 재료과학적 특성과 산지해석 (Material Characteristics and Provenance Interpretation of Jade(Amazonite) from the Sijeonri Site at Asan, Korea)

  • 이찬희;김재철;나건주;김명진
    • 헤리티지:역사와 과학
    • /
    • 제39권
    • /
    • pp.219-242
    • /
    • 2006
  • 충남 아산시 시전리 유적에서 출토된 옥기를 대상으로 고고과학적 측면에서 재질분석 및 원료산지를 해석하였다. 시전리 유적은 북쪽에 평야와 하천이 발달된 남쪽의 구릉에 위치한다. 이 지역의 지질은 선캠브리아기의 변성퇴적암류인 편암 복합체가 주류를 이루며 충적층이 넓게 분포한다. 이 유적의 청동기시대 4호 원형 주거지에서 한 점의 천하석제 옥기가 출토되었다. 이 옥기는 곡옥의 형태를 가지고 있으며 담녹색에 쪼개짐이 발달된 특징을 보인다. 또한 유리광택에 백색 조흔을 보이며 미세벽개 및 쌍정을 갖는 주상 형태의 규산염광물이다. 다각적인 정량분석 결과, 이 옥기는 광물학적으로 조장석과 정장석이 공생하는 미사장석이며, 보석학적으로는 천하석 또는 아마조나이트(amazonite)로 불리는 장석군 광물로 동정되었다. 이 천하석제 옥기의 내부조직은 Na-단종인 조장석과 K-단종인 정장석이 벽개와 쌍정을 따라 수 ${\mu}m$의 폭으로 교대조직을 이루고 있다. 또한 정장석 내부는 $K_2O$의 함량에 따라 교호성장 조직을 형성하였다. 따라서 이 천하석은 Na와 K가 상호치환과 교대 작용에 의하여 미사장석이라는 하나의 광물상을 이룬 것이다. 남한에서 천하석의 원산지는 충북 단양이 유일하며, 시전리 유적과 가장 근접한 미사장석 산지로는 공주시 장기면이 알려져 있다. 한편 청동기시대 천하석제 옥기가 다량 출토된 지역은 경남 서부 및 전남 동부의 남해안 연변으로서, 이 지역에서도 천하석의 원료가 될 만한 원광석의 산지는 알려져 있지 않다. 일반적으로 청동기시대 천하석제 식옥은 부장품으로 출토되지만, 시전리 유적에서는 옥기의 생산 및 가공흔적을 찾아볼 수 없고 유일하게 한 점이 주거지에서 수습된 것으로 볼 때, 시전리에 옥기 원료의 산지가 있거나 공방이 있었을 가능성은 없어 보인다. 따라서 이 옥기의 원산지와 유입경로 및 제작과정을 설명하기 위한 고고학적 연구가 필요하다.

초임계 복령피 추출물의 생리활성 및 경피투과 펩티드를 이용한 경피 약물전달의 응용 (Physiological Activity of Supercritical Poria cocos back Extract and Its Skin Delivery Application using Epidermal Penetrating Peptide)

  • 김민기;박수인;안규민;허수현;신문삼
    • 한국응용과학기술학회지
    • /
    • 제36권3호
    • /
    • pp.766-778
    • /
    • 2019
  • 본 연구에서는 초임계 공정에 의해 복령피를 추출하였고, 에탄올 복령피 추출물과 비교하여 항염, 미백, 항산화효과를 측정하였다. 또한 선정된 추출물의 제형과 약물전달 펩티드를 활용하여 효율적인 경피투과 방법을 제시하였다. 복령피의 항암, 항염성분으로 알려진 Pachymic acid를 지표성분으로 HPLC 분석 결과 에탄올 복령피 추출물 보다 초임계 복령피 추출물이 2배 이상 높게 추출되는 것으로 나타났다. 복령피의 항산화효과를 확인하기 위하여 DPPH 소거능과 ABTS 소거능은 복령피 에탄올 추출물이 초임계 복령피 추출물보다 더 낮은 농도에서 $IC_{50}$을 나타내었다. 하지만 RAW 264.7 세포 내 NO(Nitric oxide) 생성량을 측정한 결과에서는, 에탄올 복령피 추출물보다 초임계 복령피 추출물이 동일 농도에서 더 낮은 NO 생성량을 나타냈다. 또한 B16 melanoma 세포에 복령피 추출물을 $20{\mu}g/mL$ 농도를 72시간 처리 후 세포 내외 멜라닌 합성을 확인한 결과에서는, 에탄올 복령피 추출물과 초임계 복령피 추출물 모두 효과가 있었으며 초임계 추출물이 더 낮은 멜라닌 함량을 보였다. NO 생성량 실험에서 활용된 RAW 264.7 세포에서는 $800{\mu}g/mL$농도에서도 독성이 나타나지 않았다. 하지만 B16 melanoma 세포에서는 $50{\mu}g/mL$에서도 에탄올 추출물과 초임계 추출물 모두 60 % 미만의 생존율을 나타냈다. 초임계 복령피 추출물을 대상으로 리포좀 제형과 약물전달 펩티드를 활용하여 Franz diffusion cell 실험 결과에서는, 리포좀 제형과 약물 전달 펩티드가 초임계 복령피 추출물을 경피 투과를 증진시켜 주는 것으로 나타났다. 초임계 복령피 추출물이 다양한 효능의 화장품 소재로서 개발될 가능성이 있다고 판단된다.

긴급구조훈련 개선에 관한 의식조사 연구 -강원도 소방조직을 중심으로- (A Study on the Consciousness Survey of Improvement of Emergency Rescue Training -Based on the Fire Fighting Organizations in Gangwon Province-)

  • 최윤정;구원회;백민호
    • 한국재난정보학회 논문집
    • /
    • 제15권3호
    • /
    • pp.440-449
    • /
    • 2019
  • 연구목적 : 소방조직은 재난현장에서 가장 우선적으로 대응하는 기관으로 신속하고 체계적인 대응을 하기 위하여 긴급구조훈련을 실시하고 있다. 하지만 형식적인 훈련, 지역적 특성이나 환경적 특성이 고려되지 않는 훈련 등 긴급구조훈련의 한계점에 대한 변화와 개선의 필요성이 제기되고 있다. 연구방법 : 본 연구에서는 긴급구조훈련과 관련된 이론적 검토를 실시하고 강원지역 소방조직의 의식조사를 통하여 긴급구조훈련 개선방안을 제시하였다. 연구결과 : 긴급구조 활동 시 어려움이 있는 시설은 위험물 저장 및 처리시설이 가장 많았으며 긴급구조 대응업무의 수준은 응급복구가 미흡하다고 응답한 의견이 가장 많았다. 또한 긴급구조훈련의 효과는 도움이 된다고 응답하였지만 시나리오에 의한 훈련, 보여주기식 훈련, 매년 유사한 훈련, 현실감 없는 훈련, 유관기관의 관심 부족 및 형식적 참여 등으로 도움이 되지 않는다고 응답한 부분도 있었다. 그리고 긴급구조훈련 평가의 적절성은 대부분이 만족한다고 응답하였지만 훈련 유형과 상관없는 평가방식, 필요 이상의 훈련 규모를 설정하게 하는 평가방식, 유관기관의 형식적 참여를 유도하는 평가방식 등으로 만족하지 않는다고 응답하였다. 마지막으로 긴급 구조훈련 개선에 대한 요구도는 다양한 피해 상황을 반영한 훈련이 필요하다는 의견이 가장 많았다. 결론 : 긴급구조훈련 개선방안은 다음과 같다. 첫째, 다양한 훈련내용을 설정하고 지역의 주요 발생재난 등을 검토하여 지역적 특성에 맞게 작성해야 한다. 둘째, 소방서별 적절한 훈련계획을 위하여 긴급구조훈련계획 지침 및 매뉴얼 등을 개정하고 실무자를 대상으로 교육하고 이를 위해 긴급구조훈련에 대한 유형부터 전술, 전략까지 실무적으로 활용할 수 있도록 훈련을 정립해야 한다. 셋째, 실제 재난 발생 시 지원기관 및 유관기관의 참여도를 높이기 위하여 훈련계획단계부터 참여를 유도하고 인센티브 혹은 패널티(penalty)를 줄 수 있는 제도 등을 마련해야 한다. 넷째, 동시다발적으로 발생할 수 있는 재난 상황에 대비하여 소방서간, 권역별 훈련으로 기관별 지원태세 확립, 협조체계를 구축해야 한다. 다섯째, 긴급구조훈련 평가는 결과보다 훈련과정에 중점을 둘 수 있도록 하고 재난상황별 보완사항을 도출해내는데 관심을 두고 개선해야 한다. 특히, 세부절차에 수행여부를 평가하기 보다는 훈련의 종류나 형태 등을 고려하여야 하며 훈련 규모 보다는 훈련의 완성도(숙련도), 역할 수행여부 등을 고려할 수 있는 평가방안이 마련되어야 한다. 여섯째, 효율적인 긴급구조훈련을 위하여 실무자의 요구도를 파악하여 훈련 유형 및 방법에 대하여 소방서별 특성에 맞는 훈련으로 개선되어야 한다.

홍삼분말 입자크기에 따른 이화학적 특성 분석 (Analysis of Physicochemical Properties of Red Ginseng Powder Based on Particle Size)

  • 최희정;이상윤;이중규;박동현;백정정;이병주;김윤선;조영재;최미정
    • 산업식품공학
    • /
    • 제21권3호
    • /
    • pp.225-232
    • /
    • 2017
  • 본 연구에서는 홍삼분말 입자크기 $10.00{\mu}m$ 이하의 홍삼분말과 $100.00{\mu}m$ 이상의 홍삼분말 간의 이화학적 특성 및 추출 효율성분 함량을 비교분석하였으며, 분산안정성을 기반으로 가공공정에서 적합한 홍삼분말 입자크기를 조사하였다. 본 연구에 사용된 홍삼분말은 $158.00{\mu}m$, $8.45{\mu}m$, $6.33{\mu}m$ 의 입도크기를 가졌으며, 각각 RG A, RG B, RG C로 표현하였다. 본 연구에서는 홍삼분말(2.6%, w/v)을 증류수에 분산시킨 홍삼용액을 4주 동안 저장 온도 $4^{\circ}C$, $25^{\circ}C$, $40^{\circ}C$에 각각 보관하였으며, 이에 따른 갈색도 및 지방산패도 변화를 확인하였다. 갈색도는 홍삼분말 입자크기와 관계없이 저장온도 및 시간에 따라 갈색도 값이 감소하였으며, 지방산패도(TBA)의 값은 저장온도에 상관없이 4주 동안 유의적으로 증가하였으나 홍삼분말의 지방함량이 낮아 지방산패도 값은 0.1 미만의 낮은 값을 보였다. 분산 안정성을 나타내는 backscatterting 값은 홍삼분말을 이용한 제품 가공시 적합한 입자크기를 알아보기 위하여 측정하였으며, RG A는 RG B 및 RG C와 다르게 분산직후 바로 침전이 되어 용기의 바닥부분에서 높은 backscattering 값을 보였다. RG B는 분산 10시간 이전까지 RG C보다 낮은 TSI 값을 보였으며, 10시간 이후 RG C와 같은 분산안정성을 보였다. RG A, RG B, RG C의 DPPH 및 ABTS 자유 라디칼 소거능의 $IC_{50}$ 값들은 각각 2.74-3.34 mg/mL, 2.77-2.95 mg/mL으로 홍삼분말 입자크기에 따른 유의적인 차이를 보이지 않았다. 일반적으로 홍삼분말의 입자크기 감소는 표면적 증가로 이어져 유효성분 추출 효율성이 증가하지만, 본 실험에서 RG A, RG B, RG C 간의 유효성분 추출에 큰 차이를 보이지 않은 것은 미세한 입자가 열수추출 과정 중 입자간 뭉침현상이 발생하여 표면적 증가와 관련있는 것으로 고려된다. 홍삼분말의 ginsenoside 총 함량은 24.28 mg/g 및 24.53 mg/g로 입자크기에 따른 유의적 차이를 보이지 않았으나, ginsenoside $Rg_1$, Re, $Rh_2$ 함량은 RG C가 RG A보다 유의적으로 높은 값을 가졌다. 따라서 홍삼분말 입자크기는 갈색도, 지방산패도, 항산화 효과에 큰 영향을 미치지 않지만 미세한 입자크기를 가진 홍삼분말이 분산안정성이 좋아 홍삼분말을 이용한 홍삼제품 가공공정에 보다 적합할 것으로 사료된다.

Conditional Generative Adversarial Network(CGAN) 기반 협업 필터링 추천 시스템 (Conditional Generative Adversarial Network based Collaborative Filtering Recommendation System)

  • 강소이;신경식
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.157-173
    • /
    • 2021
  • 소비자의 욕구와 관심에 맞추어 개인화된 제품을 추천하는 추천 시스템은 비즈니스에 필수적인 기술로서의 그 중요성이 증가하고 있다. 추천 시스템의 대표적인 모형 중 협업 필터링은 우수한 성능으로 다양한 분야에서 활용되고 있다. 그러나 협업필터링은 사용자-아이템의 선호도 정보가 충분하지 않을 경우 성능이 저하되는 희소성의 문제가 있다. 또한 실제 평점 데이터의 경우 대부분 높은 점수에 데이터가 편향되어 있어 심한 불균형을 갖는다. 불균형 데이터에 협업 필터링을 적용할 경우 편향된 클래스에 과도하게 학습되어 추천 성능이 저하된다. 이러한 문제를 해결하기 위해 많은 선행연구들이 진행되어 왔지만 추가적인 외부 데이터 또는 기존의 전통적인 오버샘플링 기법에 의존한 추천을 시도하였기에 유용성이 떨어지고 추천 성능 측면에서 한계점이 있었다. 본 연구에서는 CGAN을 기반으로 협업 필터링 구현 시 발생하는 희소성 문제를 해결함과 동시에 실제 데이터에서 발생하는 데이터 불균형을 완화하여 추천의 성능을 높이는 것을 목표로 한다. CGAN을 이용하여 비어있는 사용자-아이템 매트릭스에 실제와 흡사한 가상의 데이터를 생성하여, 희소성을 가지고 있는 기존의 매트릭스로만 학습한 것과 비교했을 때 높은 정확도가 예상된다. 이 과정에서 Condition vector y를 이용하여 소수 클래스에 대한 분포를 파악하고 그 특징을 반영하여 데이터를 생성하였다. 이후 협업 필터링을 적용하고, 하이퍼파라미터 튜닝을 통해 추천 시스템의 성능을 최대화하는데 기여하였다. 비교 대상으로는 전통적인 오버샘플링 기법인 SMOTE, BorderlineSMOTE, SVM-SMOTE, ADASYN와 GAN을 사용하였다. 결과적으로 데이터 희소성을 가지고 있는 기존의 실제 데이터뿐만 아니라 기존 오버샘플링 기법들보다 제안 모형의 추천 성능이 우수함을 확인하였으며, RMSE, MAE 평가 척도에서 가장 높은 예측 정확도를 나타낸다는 사실을 증명하였다.

다중 문턱치를 이용한 입술 윤곽 검출 방법 (Lip Contour Detection by Multi-Threshold)

  • 김정엽
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권12호
    • /
    • pp.431-438
    • /
    • 2020
  • 본 논문에서는 입술 윤곽선을 검출하기 위한 다중 문턱치 기반의 검출방법을 제안하였다. 기존의 연구 중 Spyridonos 등이 제안한 방법은 입력영상을 RGB로부터 YIQ 좌표계로 변환하여 Q 성분만을 이용하여 Q 영상을 얻는다. Q 영상으로부터 변화 점 검출을 통하여 입술 모양의 좌우 끝점을 얻어낸다. 좌우 끝점에 대한 수직 좌표의 평균값을 이용하여 Q 영상을 상하로 분리하고, 상하 영역 각각에 대하여 별도로 Q값을 대상으로 문턱치를 적용하여 후보 윤곽선을 추출한다. 추출된 후보 윤곽선에 특징치 거리를 이용하여 최적의 문턱치를 찾고, 해당하는 윤곽선을 최종 입술 윤곽선으로 결정한다. 이 때 사용되는 특징치 거리 D는 후보 윤곽선 상의 점들을 기준으로 주변 영역에 대한 차이의 절대값을 이용하여 계산한다. 기존연구의 문제점은 세 가지인데, 첫째는 입술 끝점 추출 과정에서 피부영역의 과다한 참여로 입술 끝점의 추출의 정확도가 감소하고, 따라서 후속되는 상/하 영역 분리에도 영향을 미친다. 둘째는 YIQ 칼라 좌표계를 사용하였는데, 다양한 칼라 좌표계에 대한 분석이 미비하므로 추가적인 분석이 필요하다. 세 째, 최적 윤곽선의 선택 시 적용하는 거리 값 파라미터의 계산 과정에서, 문턱치를 적용하여 구한 해당 윤곽선 주변의 데이터들에 의한 변화분을 계산하여 변화가 가장 큰 윤곽선을 입술 후보로 채택하는데, 변화분의 최대치를 기준으로 하기 때문에 검출된 입술영역이 기준보다 축소되는 문제점이 있다. 첫 번째 문제점을 해결하기 위하여 피부영역의 계산과정 참여를 줄여서 성능을 30%정도 향상시켰다. 두 번째는 YIQ 외에 HSV, CIELUV, YCrCb 등의 칼라 좌표계에 대한 성능테스트를 거쳐 기존연구 방법이 칼라좌표계에 대한 의존성이 없음을 확인하였다. 세 번째는 윤곽선 주변의 변화분 검토 시, 윤곽선 포인트 당 변화분의 평균값 대신에 변화분의 총량을 적용하여 46% 성능개선 효과를 얻었다. 이상의 내용을 모두 적용하여 제안한 통합방법은 기존연구 대비 2배의 성능향상과 안정성을 확보할 수 있었다.

스마트도시서비스 공동창의자로서의 시민 역할 강화 방안 - 기능카드 기법 개발을 중심으로 - (A Plan to Strengthen the Role of Citizens as Co-Creators of Smart City Services - Focused on the Development of Function Issue Card Technology -)

  • 지상태;박준호;박정우;남광우
    • 한국지리정보학회지
    • /
    • 제24권2호
    • /
    • pp.1-11
    • /
    • 2021
  • 최근 정부는 지역특화형 스마트도시서비스(이하 스마트서비스)의 구축과 시민 체감도 향상을 위해 스마트도시사업에 지역의 사용자인 시민들의 참여를 점차 확대해가고 있다. 하지만, 스마트서비스 관련 기술에 대한 정보 부족으로 스마트서비스 구상 과정에서 시민들로부터 구체적인 수준의 의견을 도출하기에는 한계가 있었다. 이에 본 연구는 2019년 '스마트타운 챌린지 사업'으로 선정된 지자체 4곳의 보고서를 검토하여 리빙랩을 통해 스마트서비스에 대해 시민 의견의 구체화 수준을 진단하였다. 분석 결과, 리빙랩과정에서 다양한 디자인사고기법을 활용하여 스마트서비스 계획수립에 참여하였지만, 시민이 스마트서비스의 구체적인 기능을 구상하는 단계에 이르기는 한계가 있었다. 이에 본 연구에서는 스마트서비스의 정보수집, 가공, 제공 방법, 기술 등 4가지 요소와 서비스의 콘텐츠 등을 모듈한 후 이를 자유롭게 조합하여 활용 가능한 기능카드 기법을 제시하였다. 이렇게 개발된 기능카드 기법은 효과성 검증을 위해 실제 진행 중인 스마트도시사업에 적용하여 보았다. 이를 통해 기능카드가 시민들이 스마트서비스의 기능과 콘텐츠를 조합하여 상세 기능 수준으로 스마트서비스를 구체화 할 수 있도록 도움을 주고 있음을 확인하였다. 본 연구에서 제시한 기능카드 기법은 시민참여형 스마트도시 계획에서 시민들이 지역 문제해결을 위한 의견을 구체화하여 지역특화 스마트서비스를 구상하는 공동창의자로서의 역할을 수행하는데 기여할 것으로 기대한다.

고해상도 규모상세화모델 KMAPP의 농업지역 기온 및 일사량 예측 성능: 맑은 날 철원 및 전북 사례 연구 (Temperature and Solar Radiation Prediction Performance of High-resolution KMAPP Model in Agricultural Areas: Clear Sky Case Studies in Cheorwon and Jeonbuk Province)

  • 신설은;이승재;노일석;김수현;소윤영;이서연;민병훈;김규랑
    • 한국농림기상학회지
    • /
    • 제22권4호
    • /
    • pp.312-326
    • /
    • 2020
  • KMAPP은 규모상세화 과정을 통해 100 m 단위의 초고해상도 기상 예측을 산출하는 체계로써 최근 수문, 농업, 신재생에너지 등 다양한 분야에서 활용되기 시작됨에 따라 각 분야별로 예측성능을 검증할 필요가 있다. 철원 지역과 전북 지역은 산지가 많은 우리나라에서 비교적 넓은 범위에 걸쳐서 수평면을 보유하고 있으며, 특히 철원은 대규모 벼 논 재배지역 중에서 실측 및 원격탐사 생물계절 자료가 많은 지역으로 KMAPP 예측 성능을 검증하는데 필요한 관측자료를 사용하기에 적절한 지점으로 판단된다. 이번 연구에서는 철원 내 농경지역의 생태적 변화에 따라 변화하는 KMAPP 기온 예측 성능을 AWS와 ASOS 관측자료를 이용하여 비교 검증하였다. 그리고 전북지역 폭염 기간 동안 가축 고온스트레스 모델과 같은 응용모델에 KMAPP 예측 자료를 입력자료로 활용하는 것을 검토하고자 일사량 예측을 ASOS 자료를 이용하여 검증하였다. 더 많은 사례의 수집과 선정이 필요하다는 한계가 있지만 농경지역에서 추수 후 기온 예측 성능이 일반 주택지 에서보다 더 크게 향상된 것을 통해 생물리적 효과가 예측 정확도에 미치는 영향을 간접적으로 추측해 볼 수 있었다. 한편, 일사량 예측의 경우 단위 변환에 따른 오차가 발생하지만 관측값과 일치하는 경향을 보여 KMAPP 자료가 지역규모의 상세 예측 자료로 응용모델에 활용될 수 있을 것으로 기대된다.

주문생산 기업을 위한 기계학습 기반 총생산시간 예측 기법 (A Machine Learning-based Total Production Time Prediction Method for Customized-Manufacturing Companies)

  • 박도명;최형림;박병권
    • 지능정보연구
    • /
    • 제27권1호
    • /
    • pp.177-190
    • /
    • 2021
  • 4차 산업혁명 기술의 발전으로 사람이 처리하지 못하는 부분을 기계학습 등 인공지능 기법을 활용하여 개선해 보려는 노력이 확대되고 있다. 주문형 생산 기업에서도 주문에 대한 총생산시간을 예측하여 납기 지연 등의 기업 리스크를 줄이고자 하나 주문마다 총생산시간이 모두 달라 이를 예측하는데, 어려움을 겪고 있다. 주문 처리량 증대, 주문 총비용 절감을 위해 효율성이 가장 낮은 영역을 찾아 그 영역을 강화하는 TOC(Theory of constraints) 이론이 개발되었으나 총생산시간 예측은 제시하지 못하였다. 주문생산은 고객의 다양한 요구로 인해 주문마다 그 특성이 모두 다르므로 개별적인 주문의 총생산시간을 사후에 측정할 수는 있으나 사전 예측을 하기는 어렵다. 기존 주문의 이미 측정된 총생산시간도 모두 달라 표준 시간으로 활용할 수 없는 한계성이 있다. 이에 따라 경험이 많은 관리자는 시스템의 이용보다는 감에 의존하고 있고, 경험이 부족한 관리자는 간단한 관리지표(예, 원재료가 파이프이면 총생산시간 60일, 철판이면 총생산시간 90일 등)를 사용하고 있다. 불완전한 감이나 지표를 기초로 하여 작업 지시를 너무 빨리하면 정체가 발생하여 생산성이 저하되고, 너무 늦게 하면 긴급 처리로 인해 생산비용이 증가하거나 납기를 지키지 못하는 경우가 발생한다. 납기를 지키지 못하면 지체상금을 배상해야 하거나 영업, 수금 등의 부문에 악영향을 미친다. 본 연구에서는 이러한 문제를 해결하기 위하여 주문생산시스템을 운영하는 기업의 신규 주문 총생산시간을 추정하는 기계학습 모델을 찾고자 한다. 기계학습에 활용된 자료는 수주, 생산, 공정 실적을 사용한다. 그리고 총생산시간의 추정에 가장 적합한 알고리즘으로 OLS, GLM Gamma, Extra Trees, Random Forest 알고리즘 등을 비교 분석하고 그 결과를 제시하고자 한다.

전문어의 범용 공간 매핑을 위한 비선형 벡터 정렬 방법론 (Nonlinear Vector Alignment Methodology for Mapping Domain-Specific Terminology into General Space)

  • 김준우;윤병호;김남규
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.127-146
    • /
    • 2022
  • 최근 워드 임베딩이 딥러닝 기반 자연어 처리를 다루는 다양한 업무에서 우수한 성능을 나타내면서, 단어, 문장, 그리고 문서 임베딩의 고도화 및 활용에 대한 연구가 활발하게 이루어지고 있다. 예를 들어 교차 언어 전이는 서로 다른 언어 간의 의미적 교환을 가능하게 하는 분야로, 임베딩 모델의 발전과 동시에 성장하고 있다. 또한 핵심 기술인 벡터 정렬(Vector Alignment)은 임베딩 기반 다양한 분석에 적용될 수 있다는 기대에 힘입어 학계의 관심이 더욱 높아지고 있다. 특히 벡터 정렬은 최근 수요가 높아지고 있는 분야간 매핑, 즉 대용량의 범용 문서로 학습된 사전학습 언어모델의 공간에 R&D, 의료, 법률 등 전문 분야의 어휘를 매핑하거나 이들 전문 분야간의 어휘를 매핑하기 위한 실마리를 제공할 수 있을 것으로 기대된다. 하지만 학계에서 주로 연구되어 온 선형 기반 벡터 정렬은 기본적으로 통계적 선형성을 가정하기 때문에, 본질적으로 상이한 형태의 벡터 공간을 기하학적으로 유사한 것으로 간주하는 가정으로 인해 정렬 과정에서 필연적인 왜곡을 야기한다는 한계를 갖는다. 본 연구에서는 이러한 한계를 극복하기 위해 데이터의 비선형성을 효과적으로 학습하는 딥러닝 기반 벡터 정렬 방법론을 제안한다. 제안 방법론은 서로 다른 공간에서 벡터로 표현된 전문어 임베딩을 범용어 임베딩 공간에 정렬하는 스킵연결 오토인코더와 회귀 모델의 순차별 학습으로 구성되며, 학습된 두 모델의 추론을 통해 전문 어휘를 범용어 공간에 정렬할 수 있다. 제안 방법론의 성능을 검증하기 위해 2011년부터 2020년까지 수행된 국가 R&D 과제 중 '보건의료' 분야의 문서 총 77,578건에 대한 실험을 수행한 결과, 제안 방법론이 기존의 선형 벡터 정렬에 비해 코사인 유사도 측면에서 우수한 성능을 나타냄을 확인하였다.