工具使用商业来源的住宅历史为癌症研究
如何使用NCI的SAS住宅历史生成程序
这是国家癌症研究所住宅历史试点项目的一部分, hg体育官网创建“ResHistGen,一套开源SAS程序,将帮助研究人员和其他人协调来自商业供应商的数据,并生成研究参与者的居住历史.
有关住宅历史研究和SAS项目发展的更多信息,请参阅 NCI/SEER住宅历史项目[1544 kb PDF],这项研究的技术报告.
使用ResHistGen程序创建研究对象的居住历史的步骤可以由癌症登记处的工作人员执行, 研究小组成员, 或者第三方承包商的员工. 要获取这些程序以及如何使用它们的信息,请访问 GitHub库.
- 在这个过程中需要单独的患者标识符. 研究者必须遵循既定的程序来保护受试者的隐私.
- 向供应商提交相关案例的主题名称和标识符.
- 对从商业供应商收到的地址进行地理编码. 所有的你.S. 癌症登记处可以使用北美中心癌症登记处协会(NAACCR)的地理编码器, 但可以使用任何批处理地理编码器.
- 运行第一个SAS程序(01_MatchAddresses1.sas (12 kb文本文件])匹配常用地址. 对于一项只有少量研究对象的研究, 可能的匹配可以在一个两步的过程中手工检查. 对于有大量受试者的研究,这可以在单个步骤中自动完成.
- 如果需要手动检查,请编辑“LN_matchcombos_review”.由第一个程序通过删除不匹配的行创建. 本审查可参考NCI SEER手册地址比较指南[31 kb字文件]
- 运行第二个SAS程序(02_MatchAddresses2.sas (16 kb的文本文件])添加任何来自手动审查的结果,并结合匹配的地址.
- 运行第三个SAS程序03_buildreshhistory.sas (13 kb文本文件])来协调地址并生成一个派生的住宅历史.
这些程序的当前版本是版本2.1. 有关自上一个版本以来的更改摘要,请参阅版本2.1的变化.txt (3 kb文本文件].
在ResHistGen项目中, 本地文件位置在每个程序的前几行中指定,以促进可移植性. The programs have been written to avoid any data conversion or divide-by-zero warning mess年龄s; if these occur, 有一个错误. 有针对意外情况的测试, 如果遇到任何意外条件,则会生成带有三个星号(“***”)的消息.
ResHistGen项目是在 GNU通用公共许可证[34 kb文本文件]. 如有疑问,可通过电子邮件向我们提供有限的支持 NCI.ResidentialHistory@pearlpbx.com; enhancements may also be shared via this email address and if found to be beneficial, 它们将包含在未来的版本中. 根据许可证的条款, 您可以自行发布您的更改,只要您包含一个显著的通知,说明您已经修改了原始文件.
如果你根据这些程序发布结果, 请包括以下引用:ResHistGen住宅历史生成项目, 版本2.1 - October 2020; Surveillance Research Program, National Cancer Institute.