• 제목/요약/키워드: Public Portal Data

검색결과 130건 처리시간 0.027초

Prediction Model of Real Estate ROI with the LSTM Model based on AI and Bigdata

  • Lee, Jeong-hyun;Kim, Hoo-bin;Shim, Gyo-eon
    • International journal of advanced smart convergence
    • /
    • 제11권1호
    • /
    • pp.19-27
    • /
    • 2022
  • Across the world, 'housing' comprises a significant portion of wealth and assets. For this reason, fluctuations in real estate prices are highly sensitive issues to individual households. In Korea, housing prices have steadily increased over the years, and thus many Koreans view the real estate market as an effective channel for their investments. However, if one purchases a real estate property for the purpose of investing, then there are several risks involved when prices begin to fluctuate. The purpose of this study is to design a real estate price 'return rate' prediction model to help mitigate the risks involved with real estate investments and promote reasonable real estate purchases. Various approaches are explored to develop a model capable of predicting real estate prices based on an understanding of the immovability of the real estate market. This study employs the LSTM method, which is based on artificial intelligence and deep learning, to predict real estate prices and validate the model. LSTM networks are based on recurrent neural networks (RNN) but add cell states (which act as a type of conveyer belt) to the hidden states. LSTM networks are able to obtain cell states and hidden states in a recursive manner. Data on the actual trading prices of apartments in autonomous districts between January 2006 and December 2019 are collected from the Actual Trading Price Disclosure System of the Ministry of Land, Infrastructure and Transport (MOLIT). Additionally, basic data on apartments and commercial buildings are collected from the Public Data Portal and Seoul Metropolitan Government's data portal. The collected actual trading price data are scaled to monthly average trading amounts, and each data entry is pre-processed according to address to produce 168 data entries. An LSTM model for return rate prediction is prepared based on a time series dataset where the training period is set as April 2015~August 2017 (29 months), the validation period is set as September 2017~September 2018 (13 months), and the test period is set as December 2018~December 2019 (13 months). The results of the return rate prediction study are as follows. First, the model achieved a prediction similarity level of almost 76%. After collecting time series data and preparing the final prediction model, it was confirmed that 76% of models could be achieved. All in all, the results demonstrate the reliability of the LSTM-based model for return rate prediction.

텍스트 마이닝을 활용한 2017년 한국 대선 분석 (An Analysis of the 2017 Korean Presidential Election Using Text Mining)

  • 안은희;안정국
    • 한국융합학회논문지
    • /
    • 제11권5호
    • /
    • pp.199-207
    • /
    • 2020
  • 최근 빅데이터 분석은 대량의 데이터로부터 미래를 예측하여 가치를 창출할 수 있어 다양한 분야에서 주목받고 있으며, 정치 캠페인 운영이나 결과 예측에도 활용되고 있다. 하지만 기존의 연구는 특정 SNS 데이터만을 분석하여 후보자들에 대한 정보를 취합하는데 한계가 있었다. 이에 본 연구는 2017년 한국 대선 후보별 뉴스와 댓글을 수집하여 뉴스 생성 추이, 토픽 추출, 감성 분석, 키워드 분석, 키워드 감성 분석을 하였다. 분석 결과, 대선 후보 간 다양한 토픽들이 생성되는 것을 확인하였으며, 후보별 이슈가 되는 중점 키워드와 이에 대한 유권자들의 호응도가 추출되었다. 본 연구는 포털 뉴스에서 생성되는 대선 캠페인에 대한 동향을 마이닝 할 수 있게 했다는 점과 감성 분석을 통해 대권주자들에 대한 유권자들의 관심과 의견들을 정량화하여 수치화한 것에 의의가 있다. 본 연구가 여론 수렴의 도구적 방법을 제시함으로써 이를 바탕으로 전략적인 행동 방안을 도출할 수 있을 것을 기대한다.

인공지능 학습용 토공 건설장비 영상 데이터셋 구축 및 타당성 검토 (Building-up and Feasibility Study of Image Dataset of Field Construction Equipments for AI Training)

  • 나종호;신휴성;이재강;윤일동
    • 대한토목학회논문집
    • /
    • 제43권1호
    • /
    • pp.99-107
    • /
    • 2023
  • 최근 건설 현장의 안전사고 비율은 전체 산업에서 가장 높은 비중을 차지한다. 인공지능 기술을 건설 현장에 접목하기 위해서는 기초 학습 자료로 활용될 수 있는 데이터셋 확보가 필수적이다. 본 논문에서는 실제 현장 확보를 통해 원천 데이터를 수집하였으며, 토목 현장에서 주로 운용되고 있는 주요 건설장비 객체를 선정하고 약 9만장의 정지영상 데이터셋 가공을 통해 최적의 학습 데이터셋 구축을 완료하였다. 또한, 객체 인식분야의 대표적인 모델인 YOLO를 활용하여 구축된 데이터의 검증 작업을 수행하였고 90 % 근접한 검출 성능을 확인해 데이터 신뢰성을 확보하였다. 본 연구에서 사용되는 학습 데이터셋은 공공데이터포털에서 활용 가능하도록 공개를 완료하였다. 본 데이터셋은 향후 건설안전 분야의 객체 인식 기술의 건설현장 적용을 위한 기반 데이터로 활용 가능하리라 판단된다.

빅데이터 기반 소비자 유형별 농식품 추천시스템 구축 사례 (Case Study of Big Data-Based Agri-food Recommendation System According to Types of Customers)

  • 문정훈;장익훈;최영찬;김진교;박진
    • 한국통신학회논문지
    • /
    • 제40권5호
    • /
    • pp.903-913
    • /
    • 2015
  • 농림수산식품교육문화정보원에서는 2015년 1월부터 공공데이터 포털 서비스를 시작하였으며 포털 내에 구축된 빅데이터 기반 농식품 추천 시스템을 이용한 맞춤소비정보를 제공하고 있다. 추천시스템의 특징은 첫째, SNS오피니언마이닝, 소비자패널의 모든 구매내역 정보, 기후데이터, 도매가격 데이터와 같은 빅데이터의 성격을 가진 농식품분야의 다양한 데이터들을 이용하기 때문에 데이터 양의 관점에서 추천의 정확도를 높일 수 있다. 둘째, 추천시스템 구축 초기에는 사용자 정보 기반 추천이 어려운 한계를 극복할 수 있는 방법으로 식생활 라이프스타일과 메가트렌드 요인을 이용한 소비자 세분화방법을 사용한다. 이는 사용자 개인정보가 없는 상황에서도 다양한 식품 선호를 반영할 수 있도록 하여 추천실패율을 낯춘다. 셋째, 디리슐레-다항분포를 이용하는 추천 알고리즘을 적용하여 다양한 상황적 요인들의 선호가 반영된 농식품 추천이 가능하도록 하였다. 이 외에도 추천 농식품에 대한 SNS 맛집정보와 버즈량, 관련 식재료를 판매하는 주변 소매점 위치 및 가격정보 등 다양한 정보를 제공하여 농식품 분야 정보에 관심을 높일 수 있도록 시스템을 구현하였다.

Through the Looking Glass: The Role of Portals in South Korea's Online News Media Ecology

  • Dwyer, Tim;Hutchinson, Jonathon
    • Journal of Contemporary Eastern Asia
    • /
    • 제18권2호
    • /
    • pp.16-32
    • /
    • 2019
  • Media manipulation of breaking news through article selection, ranking and tweaking of social media data and comment streams is a growing concern for society. We argue that the combination of human and machine curation on media portals marks a new period for news media and journalism. Although intermediary platforms routinely claim that they are merely the neutral technological platform which facilitates news and information flows, rejecting any criticisms that they are operating as de facto media organisations; instead, we argue for an alternative, more active interpretation of their roles. In this article we provide a contemporary account of the South Korean ('Korean') online news media ecology as an exemplar of how contemporary media technologies, and in particular portals and algorithmic recommender systems, perform a powerful role in shaping the kind of news and information that citizens access. By highlighting the key stakeholders and their positions within the production, publication and distribution of news media, we argue that the overall impact of the major portal platforms of Naver and Kakao is far more consequential than simply providing an entertaining media diet for consumers. These portals are central in designing how and which news is sourced, produced and then accessed by Korean citizens. From a regulatory perspective the provision of news on the portals can be a somewhat ambiguous and moving target, subject to soft and harder regulatory measures. While we investigate a specific case study of the South Korean experience, we also trace out connections with the larger global media ecology. We have relied on policy documents, stakeholder interviews and portal user 'walk throughs' to understand the changing role of news and its surfacing on a distinctive breed of media platforms.

RIA기술을 적용한 웹 지도 서비스의 특징 연구 (The Characteristic of Web Map Service Using RIA Technologies)

  • 김문기;고준환
    • Spatial Information Research
    • /
    • 제20권2호
    • /
    • pp.35-44
    • /
    • 2012
  • 최근 국내외에서는 민간기업 뿐만 아니라 관공서에서도 웹 지도 서비스가 활발하게 이루어지고 있는 상황이다. 플랫폼으로써 데스크 탑에서부터 스마트 폰까지 다양하며, 이에 사용되는 기술도 계속 발전하고 있는 추세이다. 또한 사용자들에게 현재 서비스 중인 공간정보를 사용하여서 매쉬업 할 수 있도록 다양한 API를 제공하고 있다. 본 논문에서는 웹 지도 서비스에서 최근 유행하고 있는 RIA기술을 적용하여 각 언어별로 지도 서비스에서 가장 많이 사용하는 기능을 구현하였다. 각 웹 브라우저별로 사용자가 느끼는 속도에 대해서 실험 및 분석을 실시하였으며, 분석결과 JavaScript, Silverlight, Flex로 구현된 기능마다의 특징이 발견되었다. 실제 지도 서비스중인 서울시GIS포털시스템의 생활지도에서 직접 테스트하였다. 종합적인 결과 본 연구의 환경에서는 Silverlight의 성능이 다소 우수한 것으로 나왔다.

Adoption Factor Prediction to Prevent Euthanasia Based on Artificial Intelligence

  • KIM, Song-Eun;CHOI, Jeong-Hyun;KANG, Minsoo
    • 한국인공지능학회지
    • /
    • 제9권1호
    • /
    • pp.29-35
    • /
    • 2021
  • In this paper, we analyzed the factors of adoption and implemented a predictive model to activate the adoption of animals. Recently, animal shelters are saturated due to the abandonment and loss of companion animals. To address this, we need to find a way to encourage adoption. In this paper, a study was conducted using two data from an open data portal provided by Austin, Texas. First, a correlation analysis was conducted to identify the attributes that affect the result value, and it was found that Animal Type Intake, Intake Type, and Age upon Outcome influence the Outcome Type with correlation coefficients of 0.4, 0.26, and -0.2, respectively. For these attributes, the analysis was conducted using Multiclass Logistic Regression. As a result, dogs had a higher probability of Adoption than cats, and animals subjected to euthanasia were more likely to adopt. In the case of Public Assist and Stray, it was found that the Missing rate was high. Also, the length of stay for cats increased to 12.5 years of age, while dogs generally adopted smoothly at all ages. These results showed an overall accuracy of 62.7% and an average accuracy of 91.7%, showing a fairly reliable result. Therefore, it seems that it can be used to develop a plan to promote the adoption of animals according to various factors. Also, it can be expanded to various services by interlocking with the webserver.

Blockchain-based e-Agro Intelligent System

  • Srinivas, V. Sesha;Pompapathi, M.;Rao, G. Srinivasa;Chaitanya, Smt. M.
    • International Journal of Computer Science & Network Security
    • /
    • 제22권7호
    • /
    • pp.347-351
    • /
    • 2022
  • Farmers E-Market is a website that allows agricultural workers to direct market their products to buyers without the use of a middleman. That theory is blockchain system will be used by authors to accomplish this. The system, which is built on a public blockchain system, supports sustainability, shippers, and consumers. Farmers can keep track of their farming activities. Customers can review the product's history and track its journey through carriers to delivery after making a purchase. Farmers are encouraged to get information about their interests promptly in a blockchain-enabled system like this. This functionality is being used by small-scale farmers to form groups based on their location to attract large-scale customers, renegotiate farming techniques or volumes, and enter into contracts with buyers. The analysis shows the use of blockchain technology with a farmer's portal that keeps the video of trading data of crops, taking into account the qualities of blockchain such as values and create or transaction data. The proposal merges python as a programming language with a blockchain system to benefit farmers, vendors, and individuals by preserving transactions.

댓글 분석을 통한 19대 한국 대선 후보 이슈 파악 및 득표율 예측 (Issue tracking and voting rate prediction for 19th Korean president election candidates)

  • 서대호;김지호;김창기
    • 지능정보연구
    • /
    • 제24권3호
    • /
    • pp.199-219
    • /
    • 2018
  • 인터넷의 일상화와 각종 스마트 기기의 보급으로 이용자들로 하여금 실시간 의사소통이 가능하게 하여 기존의 커뮤니케이션 양식이 새롭게 변화되었다. 인터넷을 통한 정보주체의 변화로 인해 데이터는 더욱 방대해져서 빅데이터라 불리는 정보의 초대형화를 야기하였다. 이러한 빅데이터는 사회적 실제를 이해하기 위한 새로운 기회로 여겨지고 있다. 특히 텍스트 마이닝은 비정형 텍스트 데이터를 이용해 패턴을 탐구하여 의미있는 정보를 찾아낸다. 텍스트 데이터는 신문, 도서, 웹, SNS 등 다양한 곳에 존재하기 때문에 데이터의 양이 매우 다양하고 방대하여 사회적 실제를 이해하기 위한 데이터로 적합하다. 본 연구는 한국 최대 인터넷 포털사이트 뉴스의 댓글을 수집하여 2017년 19대 한국 대선을 대상으로 연구를 수행하였다. 대선 선거일 직전 여론조사 공표 금지기간이 포함된 2017년 4월 29일부터 2017년 5월 7일까지 226,447건의 댓글을 수집하여 빈도분석, 연관감성어 분석, 토픽 감성 분석, 후보자 득표율 예측을 수행하였다. 이를 통해 각 후보자들에 대한 이슈를 분석 및 해석하고 득표율을 예측하였다. 분석 결과 뉴스 댓글이 대선 후보들에 대한 이슈를 추적하고 득표율을 예측하기에 효과적인 도구임을 보여주었다. 대선 후보자들은 사회적 여론을 객관적으로 판단하여 선거유세 전략에 반영할 수 있고 유권자들은 각 후보자들에 대한 이슈를 파악하여 투표시 참조할 수 있다. 또한 후보자들이 빅데이터 분석을 참조하여 선거캠페인을 벌인다면 국민들은 자신들이 원하는 바가 후보자들에게 피력, 반영된다는 것을 인지하고 웹상에서 더욱 적극적인 활동을 할 것이다. 이는 국민의 정치 참여 행위로써 사회적 의의가 있다.

Digital Epidemiology: Use of Digital Data Collected for Non-epidemiological Purposes in Epidemiological Studies

  • Park, Hyeoun-Ae;Jung, Hyesil;On, Jeongah;Park, Seul Ki;Kang, Hannah
    • Healthcare Informatics Research
    • /
    • 제24권4호
    • /
    • pp.253-262
    • /
    • 2018
  • Objectives: We reviewed digital epidemiological studies to characterize how researchers are using digital data by topic domain, study purpose, data source, and analytic method. Methods: We reviewed research articles published within the last decade that used digital data to answer epidemiological research questions. Data were abstracted from these articles using a data collection tool that we developed. Finally, we summarized the characteristics of the digital epidemiological studies. Results: We identified six main topic domains: infectious diseases (58.7%), non-communicable diseases (29.4%), mental health and substance use (8.3%), general population behavior (4.6%), environmental, dietary, and lifestyle (4.6%), and vital status (0.9%). We identified four categories for the study purpose: description (22.9%), exploration (34.9%), explanation (27.5%), and prediction and control (14.7%). We identified eight categories for the data sources: web search query (52.3%), social media posts (31.2%), web portal posts (11.9%), webpage access logs (7.3%), images (7.3%), mobile phone network data (1.8%), global positioning system data (1.8%), and others (2.8%). Of these, 50.5% used correlation analyses, 41.3% regression analyses, 25.6% machine learning, and 19.3% descriptive analyses. Conclusions: Digital data collected for non-epidemiological purposes are being used to study health phenomena in a variety of topic domains. Digital epidemiology requires access to large datasets and advanced analytics. Ensuring open access is clearly at odds with the desire to have as little personal data as possible in these large datasets to protect privacy. Establishment of data cooperatives with restricted access may be a solution to this dilemma.