人才市场数据挖掘系统 各个人才网上提供了大量丰富的人才和企业信息等数据资源,但目前来说,我们对这些数据资源的利用还处于低级阶段。通过网站所提供的业务功能平台,我们能进行日常的业务处理,实现对数据记录的增加、修改、查询和删除功能,以及简单的统计功能,但这远远不能满足个人和单位会员用户的不断增长的功能需求,也不能提供深受各级领导和决策部门欢迎的分析统计和决策支持功能。因此造成了可利用数据规模大与可获取信息小的矛盾日益突出,服务质量低下,能为管理者提供决策支持的数据缺乏等一系列问题。 因此,找到有效的提供海量数据的管理与使用的平台,是一个意义重大而又亟需解决的问题。 (1)建设组织合理的数据仓库 数据仓库是一个从多个数据源收集的信息存储库,存放在一个一致的模式下,并且通常驻留在单个站点。数据仓库通过数据清理、数据变换、数据集成、数据装入和定期数据刷新过程来构造,通常,数据仓库用多维数据库结构建模,形成多维数据立方体。数据立方体提供数据的多维视图,并允许预计算和快速地访问数据。 建设一个组织较为合理的数据仓库,以实现智能化的数据采集、转换、存储功能,为挖掘算法提供一个良好的数据操纵平台。建设数据仓库主要进行以下几个工作:数据源的选择,数据立方体模型的建立,元数据的定义,ETL工具软件的开发。 (2)开发智能型的ETL工具软件 ETL工具即数据抽取、转换和装载工具,主要功能是从数据源中抽取数据后检验和整理数据,并根据数据仓库的设计要求重新组织和加工数据,装载到数据仓库的目标数据库中。为了使系统可以利用尽可能多的数据,需要支持各种常见的数据源,包括主流RDBMS(Oracle、MS SQL Server、Access、FoxPro等)、Excel以及普通文本文件。 ETL工具除了实现自动化的抽取、转换和装载功能,还必须达到一定的智能化,这样才能保证在数据源向数据仓库转化的过程中,保持高度的可靠性和一致性,使我们从数据挖掘系统获取的知识才有真实的价值。 (3)开发用户友好的可视化前端展示工具软件 为用户(业务决策人员、各级管理人员和业务分析人员)开发一套交互式、可视化、界面友好的前端数据访问和分析工具,包括基本图形功能、多坐标轴支持、饼图、折线图、堆叠图、三维图、组合图形、仪表板等图形表现工具及趋势分析工具,使从数据挖掘系统获取的知识更容易被解释和理解。 (4)实现分析报告自动生成 在广西人才网的发展中出现了各种专业化的需求,这就需要有针对性的提供专业化的服务来满足,报告无疑是人们理解数据的很好的方法。利用数据仓库,我们可以开发出各类报表,为广西人才网改进网站设计,为广西人才交流服务中心进行培训产品设计,指导人才就业和用人单位合理使用人才,为广西壮族自治区人事厅制定宏观人事政策,为高等院校规划专业布局提供可靠的数据依据。 根据数据的类型和用户的选择,系统应该可以将自动生成的报告转为Excel、Word、PPT、Text、PDF等格式的报表,也可以生成Web页面以便在互联网上发布,将报告直接向指定用户发送Email,还可以利用短信服务平台向定制用户发布信息。 (5)提供各类决策支持功能 各类分析报告为人才市场决策人员提供了依据,但决策人员更多的时候需要灵活的数据支持进行决策,这种固定格式的报告往往无法满足了他们更高的决策需要。为此,挖掘系统应提供灵活的OLAP功能,使决策人员可以方便地找到他们需要的各类数据,并能够自由地进行组合。 根据**省人才网的需求,应用以上解决方案,利用人才数据挖掘系统我们获取了以下数据挖掘与分析成果。 (1)自动实现岗位匹配报告 网络人力资源服务机构不停地构筑丰富、巨大、真实、检索方便的人才库,求职者只递交一份求职信、简历给这个网络机构,就等于递交给了所有的招聘公司。数据库的自我管理和更新的能力对求职者进行长期跟踪,并不断修正有关数据。接受网络人力资源机构服务的企业,在网络上有一个虚拟的人力资源管理社区,共享网络的所有人才数据,数据库自动构建一个最适合此家企业的人才库,从在职人才、建议聘用人才、到人才储备一应俱全。我们通过数据挖掘系统实现了这一模式。 (2)高等院校专业就业形势分析预测表 高等院校近年来的扩招,给毕业生就业工作带来了巨大压力。通过掌握来自**省高校毕业生人才库的一手数据,形成高校专业就业形势分析预测表,从而为区内高校的就业工作和大学生的就业指导提供直接的参考。同时,通过监测高校毕业生在毕业后的岗位、职位变化情况,为大学生规划职业生涯提供帮助。 (3)区域人才供求关系分析表 一般来说,人才供求关系和区域有比较强的关联,这就需要根据**省自身的具体情况进行分析,获取区域内的人才供求分析报告,以指导本区域的政策制定。 利用数据挖掘软件,通过对一段时期内数据的分析,我们不但从用人单位整体的角度了解到他们对各类岗位的需求类别、需求数量、薪金范围、福利状况等宏观数量指标,而且从应聘者的角度了解到他们对各类岗位要求的宏观数量指标,从而形成区域内的人才供求关系分析报告。有了这类报告支持,政府可以及时出台宏观政策影响各类人才供求关系,用人单位可以据此调整业务结构、修改招聘广告的发布信息、决定招聘人才的时间和间隔。 (4)岗位供求趋势分析报告 对于某些机构来讲,如培训机构,它们需要了解当前的人才供求关系,但更需要了解未来岗位供求趋势情况。该系统生成的岗位供求趋势分析报告,可以帮助各类培训机构及时调整招生计划,增减招生专业。同时,应聘者也可以及时调整自身的知识结构,使其能更好地适合所在行业的发展。 (5)高级人才数据分析报告 定期对数据进行扫描处理和分析,形成的高级人才需求分析状况和趋势变化报告,分析出高级人才跳槽的间隔、频率与薪酬变化状况,给用人企业高级人才管理提供依据,为高级人才的流动提供参考。 (6)网站用户忠诚度分析报告 一个网站只有保持一定规模的用户数量,才能够生存发展。只有了解了用户的真实需求,才能通过修改网站网页功能,使其更符合浏览者和使用者的习惯,使其保持较高的忠诚度。通过挖掘相关的 Web 日志记录,发现用户访问 Web页面的模式,从而可以识别用户的忠实度、喜好、满意度,发现潜在客户,增强站点的服务竞争力。 快速增长的人才数据资源,既给数据资源管理带来了很大的挑战,同时也给人才市场管理的发展带来了新的机遇。管理者和决策者虽然面对着内容丰富的数据资源,在制定各项管理决策时,仍然感到缺乏有用的信息,原因在于对于这些数据的理解已经远远超出了人的能力,另一方面他们缺乏从海量数据中提取有价值知识的工具。鉴于此,北京科创无限技术有限公司/苏州寰达信息科技有限公司,充分运用知识管理与数据分析的最新研究成果,将自然语言分析、关联规则、分类与预测、聚类等数据挖掘技术应用于人才市场数据资源的管理中,从而提升数据资源的价值,从大规模数据集中发现用户感兴趣的知识,然后将其应用于改进服务品质、提高决策水平,使人事人才信息管理上走向现代化、科学化。 |