<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=us-ascii">
</head>
<body style="word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class="">
This is an announcement of Emma Peterson's MS Presentation<br class="">
===============================================<br class="">
Candidate: Emma Peterson<br class="">
<br class="">
Date: Friday, April 19, 2024<br class="">
<br class="">
Time: 11 am CT<br class="">
<br class="">
Location: JCL 356<br class="">
<br class="">
Title: MARI: A Usable, Mostly Automated Redaction Interface for Unstructured Text<br class="">
<br class="">
Abstract: Social and behavioral science researchers often collect datasets of unstructured text, such as conversation transcripts. To benefit science, they often wish to share these datasets, yet first must redact identifiable information to protect participants'
 privacy. Doing so at scale requires mostly automated redaction tools that retain a dataset's utility by not over-redacting. To better understand requirements for such tools, we first interviewed ten data stewards about how they redact their own datasets, their
 threat models, and the information that would make their participants identifiable. They articulated nuanced conceptions of reidentifiability and the need to redact more than just direct personal identifiers. In response, we designed MARI, a human-in-the-loop
 redaction tool. Whereas existing tools focus on pattern matching (e.g., for addresses) and named-entity recognition, MARI incorporates additional linguistic features, a knowledge base, and language models to suggest redactions. Furthermore, MARI introduces
 a novel graphical workflow in which data stewards quickly evaluate proposed redactions. In an ablation study and comparison to three commercial tools and one academic tool, we evaluate MARI's redactions on a public dataset of caregiver-child conversations
 and a synthetic dataset representing data stewards' additional concerns. We find that MARI suggests a number of redactions existing tools miss, especially in demographic and linguistic categories.<br class="">
<br class="">
Advisors: Blase Ur<br class="">
<br class="">
Committee Members: Blase Ur, Marshini Chetty, and Alexander Kale<br class="">
<div class="">
<div dir="auto" style="caret-color: rgb(0, 0, 0); color: rgb(0, 0, 0); letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none; word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class="">
<div dir="auto" style="caret-color: rgb(0, 0, 0); color: rgb(0, 0, 0); letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none; word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class="">
<div dir="auto" style="caret-color: rgb(0, 0, 0); color: rgb(0, 0, 0); letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none; word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class="">
<div dir="auto" style="caret-color: rgb(0, 0, 0); color: rgb(0, 0, 0); letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none; word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class="">
<div dir="auto" style="caret-color: rgb(0, 0, 0); color: rgb(0, 0, 0); letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none; word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class="">
<div dir="auto" style="caret-color: rgb(0, 0, 0); color: rgb(0, 0, 0); letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none; word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class="">
<div dir="auto" style="caret-color: rgb(0, 0, 0); color: rgb(0, 0, 0); letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none; word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class="">
<br class="Apple-interchange-newline">
</div>
<br class="Apple-interchange-newline">
</div>
<br class="Apple-interchange-newline">
</div>
<br class="Apple-interchange-newline">
</div>
<br class="Apple-interchange-newline">
</div>
<br class="Apple-interchange-newline">
</div>
<br class="Apple-interchange-newline">
</div>
<br class="Apple-interchange-newline">
<br class="Apple-interchange-newline">
</div>
<br class="">
</body>
</html>