• 제목/요약/키워드: Order Imbalance Information

검색결과 72건 처리시간 0.026초

인공지능과 국토정보를 활용한 노인복지 취약지구 추출방법에 관한 연구 (A Study on the Methodology of Extracting the vulnerable districts of the Aged Welfare Using Artificial Intelligence and Geospatial Information)

  • 박지만;조두영;이상선;이민섭;남한식;양혜림
    • 지적과 국토정보
    • /
    • 제48권1호
    • /
    • pp.169-186
    • /
    • 2018
  • 급속한 고령화 사회에서 노인인구가 갖는 사회적 영향력은 더욱 가속화될 것이다. 본 연구에서는 인공지능 방법론 중 머신러닝, 인공신경망, 국토정보 분석을 통해 노인복지 취약지구를 추출하는 방법론을 정립하는데 목적을 두었다. 분석방향 정립을 위해 65세 이상 노인, 공무원, 노인복지 시설물 담당자와 인터뷰 후 방향을 설정하였다. 경기도 용인시를 대상으로 500 m 공간단위 벡터 기반 격자에 15분 이내 지리적 거리 수용력, 노인복지 향유도, 공시지가, 이동통신 기반 노인활동을 지표로 설정하였다. 10단계 군집형성 후 모의학습 결과 RBF 커널 알고리즘을 활용한 머신러닝 서포트 벡터머신에서 83.2%의 예측정확도가 나타났다. 그리고 역전파 알고리즘을 활용한 인공신경망에서 높은 상관성 결과(0.63)가 나타났다. 변수간 공간적 자기상관성을 분석하기 위해 지리적 가중회귀분석을 수행했다. 분석결과 결정계수가 70.1%로 모형으로 나타나 설명력이 우수한 것으로 나타났다. 변수의 공간적 이상값 여부와 분포패턴을 검토하기 위해 국지적인 공간적 자기상관성 지수인 Moran's I 계수와 Getis-Ord Gi 계수를 분석하였다. 분석결과 용인시 신도시인 수지 기흥구에서 노인복지 취약지구가 발생하는 특성을 보였다. 본 연구의 인공지능 모의방법과 국토정보 분석의 연계는 최근 정부의 지역여건을 고려한 노인복지 불균형을 해결하는데 활용될 수 있을 것이다.

대학입학전형에서 동일계 특별전형 합격생들에 대한 연구 (A study of college students who were granted special admissions for vocational high school students)

  • 신재경
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권4호
    • /
    • pp.763-771
    • /
    • 2013
  • 1990년 이후 국내 저 출산 붐으로 인한 대학 입시생들의 감소로 인하여 2016년 이후는 대학 정원이 수험생들의 수요보다 많은 상황으로 예측된다. 이로 인해 지방대학들의 학생 충원이 대학의 존폐여부를 좌우할 만큼 학생수급 정도가 심각한 상황으로 부각되고 있다. 따라서 전국 대부분 대학들은 우수한 인재들을 선점하기 위한 특성화 및 전문화된 방식으로 신입생들을 선발하는 다양한 전형방법을 개발하여 시행하고 있다. 본 연구는 지방의 A국립대학교를 중심으로 동일계 특별전형 입학생들에 대한 통계적 분석을 통해 이들을 효과적으로 관리할 수 있는 방법을 찾아보고자 한다. 동일계 특별전형 입학생들을 대상으로 통계적 방법을 통한 재학현황과 학내 적응여부를 분석하고 계열별 성별과의 관계를 파악하여 보다 나은 신입생 선발을 위한 방법에 대해 살펴본다. 저 출산으로 인한 학생 수의 감소로 정원 외로 전형하는 동일계 특별전형을 통해 인재를 확보하는 방안으로 활용할 수 있으며, 이를 토대로 졸업 시까지 학생들을 추수 관리할 수 있다. 또한 다른 전형으로 확대하여 분석을 하고 서로 비교한다면 앞으로의 입시정책에 적합한 전형유형을 개발할 수도 있을 것이다.

서울종합방재센터 상황실 재난상황관리능력 제고 방안 - 서울특별시 소방공무원 교육훈련을 중심으로 (A Study for Enhancing Disaster Operations Management at Seoul Emergency Operations Center - Focused on the Education and Training for Firefighters of Seoul)

  • 박순일;박찬석
    • 한국재난정보학회 논문집
    • /
    • 제14권4호
    • /
    • pp.480-491
    • /
    • 2018
  • 연구목적: 서울종합방재센터 재난상황실 재난상황관리능력 제고를 위해서 조직몰입을 높이는 사회적 지원을 구성하는 하위차원의 체계적인 관리적 접근을 제기하는 것이 본 연구의 목적이다. 연구방법: 감정노동을 독립변수로, 조직몰입을 종속변수로 하여 사회적 지원의 매개효과를 분석하였으며, 이에 근거해 재난상황관리 조직몰입을 제고시키기 위한 방안을 도출하였다. 연구결과: 조직지원 차원에서, 재난상황관리업무 객관적 평가, 재난상황관리 감정노동 완화 교육훈련 프로그램 개발, 재난상황관리 모니터링을 통해 상황관리 업무품질 개선과 업무 불균형 완화, 재난상황관리 직원의 업무 동기부여 및 보상책 마련, 재난상황실 소방공무원 감정노동 해결을 위한 체계적 업무 관리를 위해 재난상황 분석실 설치, 현재 상황관리 총괄팀과 재난상황관리 총괄운영 관리자, 재난상황관리 정보 분석가 및 개발자를 전문성을 갖춘 인재 충원이 필요하다. 둘째 관리자 지원 차원에서 역량있는 소방공무원 선발, 재난상황실 소방공무원에 대한 체계화된 단계별 감정노동에 대한 치유대책 마련, 감정노동 소방공무원을 위한 관리자의 상담역량을 갖추어야 한다. 결론: 재난상황실 재난상황관리능력 제고를 위해서는 사회적 지원에 기반한 조직몰입 제고를 위한 교육훈련프로그램의 개발이 이루어져야 한다.

국내 트위터 유저 분석을 위한 예비연구 (Preliminary Research for Korean Twitter User Analysis Focusing on Extreme Heavy User's Twitter Log)

  • 정혜란;지숙영;이중식
    • 한국HCI학회논문지
    • /
    • 제5권1호
    • /
    • pp.37-43
    • /
    • 2010
  • 트위터는 2006년 10월에 출시된 이래로 지속적으로 성장하고 있다. 특히 방문자 수 등의 수치적인 성장과 함께 마이크로 블로깅(micro blogging)이라는 새로운 소셜 네트워크의 양식을 확산시키고 있다. 국내에서도 me2day 등 '토종' 서비스가 등장했을 뿐 아니라, 향상된 모바일 디바이스의 인터넷 접근성이 마이크로 블로그의 확산을 자극 할 것으로 예측된다. 이런 맥락에서 본 연구는 마이크로 블로그라는 새로운 매체에 대한 예비 연구를 시도한다. 이를 위해, 국내 상황에 초점을 맞추어 국내 트위터 사용자 로그를 수집, 분석했다. 특히, 트위터라는 '외산' 서비스의 언어적, 문화적 장벽에도 불구하고 이를 극단적으로 활발하게 이용하는 "익스트림 헤비 유저"에 주목하여, 이들은 도대체 누구이며 왜, 어떤 방식으로 마이크로 블로그를 이용하는지 검토했다. 먼저, 무작위 추출 방식으로 일정 수준의 표본을 수집하여 팔로우와 메시지 작성 활동의 전반적인 양상을 검토하였다. 여기서 로렌츠 커브를 적용하여 활동의 쏠림 현상을 확인하였고, 이 곡선을 토대로 국내 트위터 강참여자 집단인 익스트림 헤비 유저 그룹을 도출하였다. 본 연구에서 확보한 표본 가운데에는 총 6명의 익스트림 헤비 유저가 있었고, 이들의 2010년 1월 중 일주일치의 실제 트위터 로그를 추가로 수집하여 분석하였다. 결과적으로 이들은 모바일과 데스크탑에서 다수의 클라이언트를 이용하여 다양한 방식으로 트위터에 접근하고 있었으며, 인터넷 이용 시간과 유사한 패턴으로 이용하되, 생활 속에서 "촘촘한(micro)" 시간 간격으로 꾸준히 많은 양의 메시지를 작성하고 있었다. 중요한 정보, 특별한 이벤트나 감정을 다룰 뿐 아니라, 습관적으로 트위터를 이용하고 있었으며 무엇보다 이들은 마치 SMS나 인터넷 메신저처럼 일종의 '대화의 도구'로써 트위터를 이용하고 있었다. 수집기간 중 이들이 작성한 트윗의 68%가 대화형에 속하는 것으로 나타났다. 또한 나머지 중 24%는 리트윗으로, 가상적으로(virtually) 연결된 '사람' 및 '관계'가 발화의 지배적인 동인(trigger)으로 작용하고 있음을 확인하였다.

  • PDF

서비스 지향적인 효율적인 클러스터 서버 구축 및 관리 (Efficient Cluster Server Construction and Management for Service Orientation)

  • 채희성;송하윤;김한규;이기철
    • 정보처리학회논문지A
    • /
    • 제14A권6호
    • /
    • pp.371-382
    • /
    • 2007
  • 현대의 서버 시스템은 대부분의 경우 클러스터 시스템으로 이루어지어 가능한 많은 사용자를 지원할 뿐만 아니라 가능한 많은 어플리케이션을 지원하는 것을 목적으로 하는 서비스 지향 클러스터 시스템이다. 클러스터 시스템 아키텍쳐의 발전으로 자바 프레임웍에 기반한 미들웨어 어프로치가 발전하고 있다. 미들웨어에 의한 방법은 서버 시스템의 성능과 어플리케이션의 활용도를 보장하면서도 서버 시스템 구축을 위한 대부분의 노력을 덜어준다. 본 연구에서는 JMX를 이용하여 클러스터 시스템의 손쉬운 구현과 관리를 달성할 수 있는 새로운 클러스터 시스템을 소개한다. 일단 클러스터 시스템의 구축과 구성단계를 보이며, 어플리케이션과 시스템 양자에 걸쳐서 손쉬운 구축과 확장, 그리고 관리가 미들웨어에 기반한 시스템에서 이루어짐을 보인다. 덧붙여 서비스 지향 클러스터 시스템이 미들웨어에 기반하여 우수한 성능을 보임을 성능 평가 실험 결과를 통하여 검증하였다. 기본적인 성능 평가 결과는 서버의 가용성, 그리고 로드 밸런싱과 스케쥴링 알고리즘의 효율성을 검증하였다. 특히, 우리의 서비스기반 스케줄링 방법이 정상부하시 적재불균형문제와 과부하시의 대처능력에서 타 방법에 비해 우수함을 보였다.

데이터의 불균형성을 제거한 네트워크 침입 탐지 모델 비교 분석 (Experimental Comparison of Network Intrusion Detection Models Solving Imbalanced Data Problem)

  • 이종화;방지원;김종욱;최미정
    • KNOM Review
    • /
    • 제23권2호
    • /
    • pp.18-28
    • /
    • 2020
  • 컴퓨팅 환경의 발전에 따라 IT 기술이 의료, 산업, 통신, 문화 등의 분야에서 사람들에게 제공해주는 혜택이 늘어나 삶의 질도 향상되고 있다. 그에 따라 발전된 네트워크 환경을 노리는 다양한 악의적인 공격이 존재한다. 이러한 공격들을 사전에 탐지하기 위해 방화벽, 침입 탐지 시스템 등이 존재하지만, 나날이 진화하는 악성 공격들을 탐지하는 데에는 한계가 있다. 이를 해결하기 위해 기계 학습을 이용한 침입 탐지 연구가 활발히 진행되고 있지만, 학습 데이터셋의 불균형으로 인한 오탐 및 미탐이 발생하고 있다. 본 논문에서는 네트워크 침입 탐지에 사용되는 UNSW-NB15 데이터셋의 불균형성 문제를 해결하기 위해 랜덤 오버샘플링 방법을 사용했다. 실험을 통해 모델들의 accuracy, precision, recall, F1-score, 학습 및 예측 시간, 하드웨어 자원 소모량을 비교 분석했다. 나아가 본 연구를 기반으로 랜덤 오버샘플링 방법 이외에 불균형한 데이터 문제를 해결할 수 있는 다른 방법들과 성능이 높은 모델들을 이용하여 좀 더 효율적인 네트워크 침입 탐지 모델 연구로 발전시키고자 한다.

다양한 데이터 전처리 기법 기반 침입탐지 시스템의 이상탐지 정확도 비교 연구 (Comparative Study of Anomaly Detection Accuracy of Intrusion Detection Systems Based on Various Data Preprocessing Techniques)

  • 박경선;김강석
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권11호
    • /
    • pp.449-456
    • /
    • 2021
  • 침입 탐지 시스템(IDS: Intrusion Detection System)은 보안을 침해하는 이상 행위를 탐지하는 기술로서 비정상적인 조작을 탐지하고 시스템 공격을 방지한다. 기존의 침입탐지 시스템은 트래픽 패턴을 통계 기반으로 분석하여 설계하였다. 그러나 급속도로 성장하는 기술에 의해 현대의 시스템은 다양한 트래픽을 생성하기 때문에 기존의 방법은 한계점이 명확해졌다. 이런 한계점을 극복하기 위해 다양한 기계학습 기법을 적용한 침입탐지 방법의 연구가 활발히 진행되고 있다. 본 논문에서는 다양한 네트워크 환경의 트래픽을 시뮬레이션 장비에서 생성한 NGIDS-DS(Next Generation IDS Dataset)를 이용하여 이상(Anomaly) 탐지 정확도를 높일 수 있는 데이터 전처리 기법에 관한 비교 연구를 진행하였다. 데이터 전처리로 패딩(Padding)과 슬라이딩 윈도우(Sliding Window)를 사용하였고, 정상 데이터 비율과 이상 데이터 비율의 불균형 문제를 해결하기 위해 AAE(Adversarial Auto-Encoder)를 적용한 오버샘플링 기법 등을 적용하였다. 또한, 전처리된 시퀀스 데이터의 특징벡터를 추출할 수 있는 Word2Vec 기법 중 Skip-gram을 이용하여 탐지 정확도의 성능 향상을 확인하였다. 비교실험을 위한 모델로는 PCA-SVM과 GRU를 사용하였고, 실험 결과는 슬라이딩 윈도우, Skip-gram, AAE, GRU를 적용하였을 때, 더 좋은 성능을 보였다.

회사채 신용등급 예측을 위한 SVM 앙상블학습 (Ensemble Learning with Support Vector Machines for Bond Rating)

  • 김명종
    • 지능정보연구
    • /
    • 제18권2호
    • /
    • pp.29-45
    • /
    • 2012
  • 회사채 신용등급은 투자자의 입장에서는 수익률 결정의 중요한 요소이며 기업의 입장에서는 자본비용 및 기업 가치와 관련된 중요한 재무의사결정사항으로 정교한 신용등급 예측 모형의 개발은 재무 및 회계 분야에서 오랫동안 전통적인 연구 주제가 되어왔다. 그러나, 회사채 신용등급 예측 모형의 성과와 관련된 가장 중요한 문제는 등급별 데이터의 불균형 문제이다. 예측 문제에 있어서 데이터 불균형(Data imbalance) 은 사용되는 표본이 특정 범주에 편중되었을 때 나타난다. 데이터 불균형이 심화됨에 따라 범주 사이의 분류경계영역이 왜곡되므로 분류자의 학습성과가 저하되게 된다. 본 연구에서는 데이터 불균형 문제가 존재하는 다분류 문제를 효과적으로 해결하기 위한 다분류 기하평균 부스팅 기법 (Multiclass Geometric Mean-based Boosting MGM-Boost)을 제안하고자 한다. MGM-Boost 알고리즘은 부스팅 알고리즘에 기하평균 개념을 도입한 것으로 오분류된 표본에 대한 학습을 강화할 수 있으며 불균형 분포를 보이는 각 범주의 예측정확도를 동시에 고려한 학습이 가능하다는 장점이 있다. 회사채 신용등급 예측문제를 활용하여 MGM-Boost의 성과를 검증한 결과 SVM 및 AdaBoost 기법과 비교하여 통계적으로 유의적인 성과개선 효과를 보여주었으며 데이터 불균형 하에서도 벤치마킹 모형과 비교하여 견고한 학습성과를 나타냈다.

충남지역 시설 딸기재배지 시비수준과 토양 화학성과의 관계 (Relationship between Fertilizer Application Level and Soil Chemical Properties for Strawberry Cultivation under Greenhouse in Chungnam Province)

  • 최문태;이진일;윤여욱;이종은;이봉춘;양의석;이영한
    • 한국토양비료학회지
    • /
    • 제43권2호
    • /
    • pp.153-159
    • /
    • 2010
  • 우리나라 농민들은 저투입 지속가능한 농업 보다 화학비료에 더욱 의존하고 있다. 딸기 시설 재배지에서 친환경 농업을 추진하기 위해서 토양 양분 불균형을 개선하도록 충남지역 56개소의 양분관리 조건과 토양 화학성과의 관계를 구명하였다. 퇴비 시용량은 40대가 40 Mg $ha^{-1}$로 표준시비량 보다 2배 높았고 50대는 밑비료 시용량으로 질소 105.2, 인산 58.3, 칼륨 68.1 Mg $ha^{-1}$로 표준시비량 보다 각각 질소는 3배, 인산과 칼륨은 1.2배 였다. 딸기 재배 경력은 10년 이하가 42.8%로 비율이 높았고 재배면적은 400 $m^2$ 이하인 농가가 75.0%의 높은 비율을 나타냈다. 돈분 퇴비를 시용하는 농가는 48.2%로 가장 높았으며 밑비료 질소 평균 시비량은 92.3 Mg $ha^{-1}$로 표준시비량의 2.6배 였다. 또한, 퇴비 시용량이 30 Mg $ha^{-1}$를 초과하는 경우 적정수준에 비해 토양 EC 값은 1.8배, 유효인산 함량은 3.0배, 치환성 칼륨 함량은 2.6배, 칼슘 함량은 1.7배, 마그네슘 함량은 1.6배 높았으며 토양의 유효인산 평균 함량은 986 mg $kg^{-1}$으로 적정수준 보다 2.2배 높았다. 주성분 분석결과 PC 1은 토양 유효인산 (0.342), 토양 치환성 칼슘 (0.327), 토양 EC (0.310), 토양 유기물 (0.289) 순으로 정의 기여를 보였으며 PC 1은 39.6%, PC 2는 17.3%, PC 3은 13.6%로서 전체 70.5%의 자료를 설명할 수 있었다. 퇴비 시용량이 증가할수록 토양의 유효인산 함량 (r=0.370, $p{\leq}0.01$), 치환성 칼륨 (r=0.429, $p{\leq}0.01$), 칼슘 (r=0.404, $p{\leq}0.01$), 마그네슘 (r=0.453, $p{\leq}0.01$) 및 나트륨 (r=0.369, $p{\leq}0.01$)과 고도의 유의성 있는 정의상관을 보여 퇴비 시용량을 적정수준으로 조절하는 것이 매우 중요할 것으로 판단되었다. 본 연구결과 딸기 시설 재배지는 연령, 재배경력, 재배면적, 축분 퇴비 종류, 퇴비 시용량에 따라 많은 차이가 있어 지속농업을 위한 근본적인 토양 양분 관리방안은 농가별 토양검정에 의한 최적 시비라고 제안한다.

EPC 프로젝트의 위험 관리를 위한 ITB 문서 조항 분류 모델 연구: 딥러닝 기반 PLM 앙상블 기법 활용 (Research on ITB Contract Terms Classification Model for Risk Management in EPC Projects: Deep Learning-Based PLM Ensemble Techniques)

  • 이현상;이원석;조보근;이희준;오상진;유상우;남마루;이현식
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권11호
    • /
    • pp.471-480
    • /
    • 2023
  • 국내 건설수주 규모는 2013년 91.3조원에서 2021년 총 212조원으로 특히 민간부문에서 크게 성장하였다. 국내외 시장 규모가 성장하면서, EPC(Engineering, Procurement, Construction) 프로젝트의 규모와 복잡성이 더욱 증가되고, 이에 프로젝트 관리 및 ITB(Invitation to Bid) 문서의 위험 관리가 중요한 이슈가 되고 있다. EPC 프로젝트 발주 이후 입찰 절차에서 실제 건설 회사에게 부여되는 대응 시간은 한정적일 뿐만 아니라, 인력 및 비용의 문제로 ITB 문서 계약 조항의 모든 리스크를 검토하는데 매우 어려움이 있다. 기존 연구에서는 이와 같은 문제를 해결하고자 EPC 계약 문서의 위험 조항을 범주화하고, 이를 AI 기반으로 탐지하려는 시도가 있었으나, 이는 레이블링 데이터 활용의 한계와 클래스 불균형과 같은 데이터 측면의 문제로 실무에서 활용할 수 있는 수준의 지원 시스템으로 활용하기 어려운 상황이다. 따라서 본 연구는 기존 연구와 같이 위험 조항 자체를 정의하고 분류하는 것이 아니라, FIDIC Yellow 2017(국제 컨설팅엔지니어링 연맹 표준 계약 조건) 기준 계약 조항을 세부적으로 분류할 수 있는 AI 모델을 개발하고자 한다. 프로젝트의 규모, 유형에 따라서 세부적으로 검토해야 하는 계약 조항이 다를 수 있기 때문에 이와 같은 다중 텍스트 분류 기능이 필요하다. 본 연구는 다중 텍스트 분류 모델의 성능 고도화를 위해서 최근 텍스트 데이터의 컨텍스트를 효율적으로 학습할 수 있는 ELECTRA PLM(Pre-trained Language Model)을 사전학습 단계부터 개발하고, 해당 모델의 성능을 검증하기 위해서 총 4단계 실험을 진행했다. 실험 결과, 자체 개발한 ITB-ELECTRA 모델 및 Legal-BERT의 앙상블 버전이 57개 계약 조항 분류에서 가중 평균 F1-Score 기준 76%로 가장 우수한 성능을 달성했다.