<div dir="ltr"><div dir="ltr"><div class="gmail_default" style="font-size:small"><div class="gmail_default" style="color:rgb(80,0,80)"><div class="gmail_default"><p style="font-variant-numeric:normal;font-variant-east-asian:normal;font-stretch:normal;line-height:normal;margin:0px"><font face="arial, sans-serif"><font style="vertical-align:inherit"><font style="vertical-align:inherit"><b>When:</b>    </font></font><font style="vertical-align:inherit"><font style="vertical-align:inherit">  Thursday, February 11th at<b> 11:10 am CT</b></font></font><br></font></p><p class="MsoNormal" style="margin:0in 0in 0.0001pt;line-height:normal;background-image:initial;background-position:initial;background-size:initial;background-repeat:initial;background-origin:initial;background-clip:initial"><font face="arial, sans-serif"> </font></p><p class="MsoNormal" style="margin:0in 0in 0.0001pt;line-height:normal;background-image:initial;background-position:initial;background-size:initial;background-repeat:initial;background-origin:initial;background-clip:initial"><font face="arial, sans-serif"><font style="vertical-align:inherit"><font style="vertical-align:inherit"><b>Where:</b>     </font></font><font color="#000000">Zoom Virtual Talk (</font><b><font color="#0000ff"><a href="https://uchicagogroup.zoom.us/webinar/register/WN_I0AksS6uQc6AMDukDKcKJg" target="_blank">register in advance here</a></font></b><font color="#000000">)</font></font></p><p class="MsoNormal" style="margin:0in 0in 0.0001pt;line-height:normal;background-image:initial;background-position:initial;background-size:initial;background-repeat:initial;background-origin:initial;background-clip:initial"><font face="arial, sans-serif"> </font></p><p class="MsoNormal" style="margin:0in 0in 0.0001pt;line-height:normal;background-image:initial;background-position:initial;background-size:initial;background-repeat:initial;background-origin:initial;background-clip:initial"><font face="arial, sans-serif"><font style="vertical-align:inherit"><font style="vertical-align:inherit"><b>Who: </b>       Stephen Mussmann, Stanford University</font></font></font></p></div><div class="gmail_default"><font face="arial, sans-serif"><br></font></div><p style="color:rgb(60,64,67);letter-spacing:0.2px;white-space:pre-wrap"><font face="arial, sans-serif"><b>Title:        </b>Bridging Theory and Practice in Active Learning</font></p><p style="color:rgb(60,64,67);letter-spacing:0.2px;white-space:pre-wrap"><font face="arial, sans-serif"><b>Abstract: </b>The size of modern datasets has powered many recent successes in machine learning, but also has made data collection expensive. Adaptive data collection, or active learning, can require fewer labels both in theory and practice. Unfortunately, in the active learning literature, theory and practice are quite distinct and disconnected. In this talk, I work to bridge this gap by presenting three projects: one connecting theory and practice, one practical, and one theoretical. In the first project, we show empirically and theoretically that the data efficiency of uncertainty sampling is inversely proportional to the error of the optimal classifier for logistic regression. In the second project, we then use this insight to apply uncertainty sampling to an extremely imbalanced pairwise classification task, paraphrase detection, where we achieve a fourteen-fold reduction in the amount of data required to reach a particular performance level. Finally, in the third project, for a classic formulation of active learning, decision trees, we provide a tight analysis of the greedy algorithm with a uniform prior, resolving a 20-year-old conjecture and yielding a subexponential time algorithm.</font></p><font face="arial, sans-serif"><b style="color:rgb(60,64,67);letter-spacing:0.2px;white-space:pre-wrap">Bio:</b><br style="color:rgb(60,64,67);letter-spacing:0.2px;white-space:pre-wrap"><span style="color:rgb(60,64,67);letter-spacing:0.2px;white-space:pre-wrap">Steve Mussmann is a PhD candidate in Computer Science at Stanford University advised by Percy Liang and in his sixth and final year. His research goal is to develop and understand methods to adaptively collect data more efficiently. He received his B.S. from Purdue University in 2015 and was supported during his PhD by a 2016 NSF GRFP fellowship.</span><br clear="all"></font></div><div class="gmail_default" style="color:rgb(80,0,80)"><span style="color:rgb(60,64,67);letter-spacing:0.2px;white-space:pre-wrap"><font face="arial, sans-serif"><br></font></span></div><div class="gmail_default" style="color:rgb(80,0,80)"><span style="color:rgb(60,64,67);letter-spacing:0.2px;white-space:pre-wrap"><font face="arial, sans-serif"><b>Host:</b> <a href="mailto:nati@ttic.edu" target="_blank"><b>Nathan Srebro</b></a></font></span></div></div><div><div dir="ltr" class="gmail_signature" data-smartmail="gmail_signature"><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><font face="arial, helvetica, sans-serif">Mary C. Marre</font><div><font face="arial, helvetica, sans-serif">Faculty Administrative Support</font></div><div><i><font face="arial, helvetica, sans-serif" color="#3d85c6"><b>Toyota Technological Institute</b></font></i></div><div><i><font face="arial, helvetica, sans-serif" color="#3d85c6">6045 S. Kenwood Avenue</font></i></div><div><i><font face="arial, helvetica, sans-serif" color="#3d85c6">Room 517</font></i></div><div><i><font face="arial, helvetica, sans-serif" color="#3d85c6">Chicago, IL  60637</font></i></div><div><i><font face="arial, helvetica, sans-serif">p:(773) 834-1757</font></i></div><div><i><font face="arial, helvetica, sans-serif">f: (773) 357-6970</font></i></div><div><b><i><a href="mailto:mmarre@ttic.edu" target="_blank"><font face="arial, helvetica, sans-serif">mmarre@ttic.edu</font></a></i></b></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div><br></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Thu, Feb 11, 2021 at 10:08 AM Mary Marre <<a href="mailto:mmarre@ttic.edu">mmarre@ttic.edu</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr"><div dir="ltr"><div style="font-size:small"><div><div><p style="font-variant-numeric:normal;font-variant-east-asian:normal;font-stretch:normal;line-height:normal;margin:0px"><font face="arial, sans-serif"><font style="vertical-align:inherit"><font style="vertical-align:inherit"><b>When:</b>    </font></font><font style="vertical-align:inherit"><font style="vertical-align:inherit">  Thursday, February 11th at<b> 11:10 am CT</b></font></font><br></font></p><p class="MsoNormal" style="margin:0in 0in 0.0001pt;line-height:normal;background-image:initial;background-position:initial;background-size:initial;background-repeat:initial;background-origin:initial;background-clip:initial"><font face="arial, sans-serif"> </font></p><p class="MsoNormal" style="margin:0in 0in 0.0001pt;line-height:normal;background-image:initial;background-position:initial;background-size:initial;background-repeat:initial;background-origin:initial;background-clip:initial"><font face="arial, sans-serif"><font style="vertical-align:inherit"><font style="vertical-align:inherit"><b>Where:</b>     </font></font><font color="#000000">Zoom Virtual Talk (</font><b><font color="#0000ff"><a href="https://uchicagogroup.zoom.us/webinar/register/WN_I0AksS6uQc6AMDukDKcKJg" target="_blank">register in advance here</a></font></b><font color="#000000">)</font></font></p><p class="MsoNormal" style="margin:0in 0in 0.0001pt;line-height:normal;background-image:initial;background-position:initial;background-size:initial;background-repeat:initial;background-origin:initial;background-clip:initial"><font face="arial, sans-serif"> </font></p><p class="MsoNormal" style="margin:0in 0in 0.0001pt;line-height:normal;background-image:initial;background-position:initial;background-size:initial;background-repeat:initial;background-origin:initial;background-clip:initial"><font face="arial, sans-serif"><font style="vertical-align:inherit"><font style="vertical-align:inherit"><b>Who: </b>       Stephen Mussmann, Stanford University</font></font></font></p></div><div><font face="arial, sans-serif"><br></font></div><p style="color:rgb(60,64,67);letter-spacing:0.2px;white-space:pre-wrap"><font face="arial, sans-serif"><b>Title:        </b>Bridging Theory and Practice in Active Learning</font></p><p style="color:rgb(60,64,67);letter-spacing:0.2px;white-space:pre-wrap"><font face="arial, sans-serif"><b>Abstract: </b>The size of modern datasets has powered many recent successes in machine learning, but also has made data collection expensive. Adaptive data collection, or active learning, can require fewer labels both in theory and practice. Unfortunately, in the active learning literature, theory and practice are quite distinct and disconnected. In this talk, I work to bridge this gap by presenting three projects: one connecting theory and practice, one practical, and one theoretical. In the first project, we show empirically and theoretically that the data efficiency of uncertainty sampling is inversely proportional to the error of the optimal classifier for logistic regression. In the second project, we then use this insight to apply uncertainty sampling to an extremely imbalanced pairwise classification task, paraphrase detection, where we achieve a fourteen-fold reduction in the amount of data required to reach a particular performance level. Finally, in the third project, for a classic formulation of active learning, decision trees, we provide a tight analysis of the greedy algorithm with a uniform prior, resolving a 20-year-old conjecture and yielding a subexponential time algorithm.</font></p><font face="arial, sans-serif"><b style="color:rgb(60,64,67);letter-spacing:0.2px;white-space:pre-wrap">Bio:</b><br style="color:rgb(60,64,67);letter-spacing:0.2px;white-space:pre-wrap"><span style="color:rgb(60,64,67);letter-spacing:0.2px;white-space:pre-wrap">Steve Mussmann is a PhD candidate in Computer Science at Stanford University advised by Percy Liang and in his sixth and final year. His research goal is to develop and understand methods to adaptively collect data more efficiently. He received his B.S. from Purdue University in 2015 and was supported during his PhD by a 2016 NSF GRFP fellowship.</span><br clear="all"></font></div><div><span style="color:rgb(60,64,67);letter-spacing:0.2px;white-space:pre-wrap"><font face="arial, sans-serif"><br></font></span></div><div><span style="color:rgb(60,64,67);letter-spacing:0.2px;white-space:pre-wrap"><font face="arial, sans-serif"><b>Host:</b> <a href="mailto:nati@ttic.edu" target="_blank"><b>Nathan Srebro</b></a></font></span></div><br></div><div style="font-size:small"><br></div><div style="font-size:small"><br></div><div><div dir="ltr"><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><font face="arial, helvetica, sans-serif">Mary C. Marre</font><div><font face="arial, helvetica, sans-serif">Faculty Administrative Support</font></div><div><i><font face="arial, helvetica, sans-serif" color="#3d85c6"><b>Toyota Technological Institute</b></font></i></div><div><i><font face="arial, helvetica, sans-serif" color="#3d85c6">6045 S. Kenwood Avenue</font></i></div><div><i><font face="arial, helvetica, sans-serif" color="#3d85c6">Room 517</font></i></div><div><i><font face="arial, helvetica, sans-serif" color="#3d85c6">Chicago, IL  60637</font></i></div><div><i><font face="arial, helvetica, sans-serif">p:(773) 834-1757</font></i></div><div><i><font face="arial, helvetica, sans-serif">f: (773) 357-6970</font></i></div><div><b><i><a href="mailto:mmarre@ttic.edu" target="_blank"><font face="arial, helvetica, sans-serif">mmarre@ttic.edu</font></a></i></b></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div><br></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Wed, Feb 10, 2021 at 3:34 PM Mary Marre <<a href="mailto:mmarre@ttic.edu" target="_blank">mmarre@ttic.edu</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr"><div dir="ltr"><div style="font-size:small"><div><div><p style="font-variant-numeric:normal;font-variant-east-asian:normal;font-stretch:normal;line-height:normal;margin:0px"><font face="arial, sans-serif"><font style="vertical-align:inherit"><font style="vertical-align:inherit"><b>When:</b>    </font></font><font style="vertical-align:inherit"><font style="vertical-align:inherit">  Thursday, February 11th at<b> 11:10 am CT</b></font></font><br></font></p><p class="MsoNormal" style="margin:0in 0in 0.0001pt;line-height:normal;background-image:initial;background-position:initial;background-size:initial;background-repeat:initial;background-origin:initial;background-clip:initial"><font face="arial, sans-serif"> </font></p><p class="MsoNormal" style="margin:0in 0in 0.0001pt;line-height:normal;background-image:initial;background-position:initial;background-size:initial;background-repeat:initial;background-origin:initial;background-clip:initial"><font face="arial, sans-serif"><font style="vertical-align:inherit"><font style="vertical-align:inherit"><b>Where:</b>     </font></font><font color="#000000">Zoom Virtual Talk (</font><b><font color="#0000ff"><a href="https://uchicagogroup.zoom.us/webinar/register/WN_I0AksS6uQc6AMDukDKcKJg" target="_blank">register in advance here</a></font></b><font color="#000000">)</font></font></p><p class="MsoNormal" style="margin:0in 0in 0.0001pt;line-height:normal;background-image:initial;background-position:initial;background-size:initial;background-repeat:initial;background-origin:initial;background-clip:initial"><font face="arial, sans-serif"> </font></p><p class="MsoNormal" style="margin:0in 0in 0.0001pt;line-height:normal;background-image:initial;background-position:initial;background-size:initial;background-repeat:initial;background-origin:initial;background-clip:initial"><font face="arial, sans-serif"><font style="vertical-align:inherit"><font style="vertical-align:inherit"><b>Who: </b>       Stephen Mussmann, Stanford University</font></font></font></p></div><div><font face="arial, sans-serif"><br></font></div><p style="color:rgb(60,64,67);letter-spacing:0.2px;white-space:pre-wrap"><font face="arial, sans-serif"><b>Title:        </b>Bridging Theory and Practice in Active Learning</font></p><p style="color:rgb(60,64,67);letter-spacing:0.2px;white-space:pre-wrap"><font face="arial, sans-serif"><b>Abstract:<br></b>The size of modern datasets has powered many recent successes in machine learning, but also has made data collection expensive. Adaptive data collection, or active learning, can require fewer labels both in theory and practice. Unfortunately, in the active learning literature, theory and practice are quite distinct and disconnected. In this talk, I work to bridge this gap by presenting three projects: one connecting theory and practice, one practical, and one theoretical. In the first project, we show empirically and theoretically that the data efficiency of uncertainty sampling is inversely proportional to the error of the optimal classifier for logistic regression. In the second project, we then use this insight to apply uncertainty sampling to an extremely imbalanced pairwise classification task, paraphrase detection, where we achieve a fourteen-fold reduction in the amount of data required to reach a particular performance level. Finally, in the third project, for a classic formulation of active learning, decision trees, we provide a tight analysis of the greedy algorithm with a uniform prior, resolving a 20-year-old conjecture and yielding a subexponential time algorithm.</font></p><font face="arial, sans-serif"><b style="color:rgb(60,64,67);letter-spacing:0.2px;white-space:pre-wrap">Bio:</b><br style="color:rgb(60,64,67);letter-spacing:0.2px;white-space:pre-wrap"><span style="color:rgb(60,64,67);letter-spacing:0.2px;white-space:pre-wrap">Steve Mussmann is a PhD candidate in Computer Science at Stanford University advised by Percy Liang and in his sixth and final year. His research goal is to develop and understand methods to adaptively collect data more efficiently. He received his B.S. from Purdue University in 2015 and was supported during his PhD by a 2016 NSF GRFP fellowship.</span><br clear="all"></font></div><div><span style="color:rgb(60,64,67);letter-spacing:0.2px;white-space:pre-wrap"><font face="arial, sans-serif"><br></font></span></div><div><span style="color:rgb(60,64,67);letter-spacing:0.2px;white-space:pre-wrap"><font face="arial, sans-serif"><b>Host:</b> <a href="mailto:nati@ttic.edu" target="_blank"><b>Nathan Srebro</b></a></font></span></div><br></div><div style="font-size:small"><br></div><div style="font-size:small"><br></div><div><div dir="ltr"><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><font face="arial, helvetica, sans-serif">Mary C. Marre</font><div><font face="arial, helvetica, sans-serif">Faculty Administrative Support</font></div><div><i><font face="arial, helvetica, sans-serif" color="#3d85c6"><b>Toyota Technological Institute</b></font></i></div><div><i><font face="arial, helvetica, sans-serif" color="#3d85c6">6045 S. Kenwood Avenue</font></i></div><div><i><font face="arial, helvetica, sans-serif" color="#3d85c6">Room 517</font></i></div><div><i><font face="arial, helvetica, sans-serif" color="#3d85c6">Chicago, IL  60637</font></i></div><div><i><font face="arial, helvetica, sans-serif">p:(773) 834-1757</font></i></div><div><i><font face="arial, helvetica, sans-serif">f: (773) 357-6970</font></i></div><div><b><i><a href="mailto:mmarre@ttic.edu" target="_blank"><font face="arial, helvetica, sans-serif">mmarre@ttic.edu</font></a></i></b></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div><br></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Thu, Feb 4, 2021 at 7:33 PM Mary Marre <<a href="mailto:mmarre@ttic.edu" target="_blank">mmarre@ttic.edu</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr"><div><div><p style="font-variant-numeric:normal;font-variant-east-asian:normal;font-stretch:normal;line-height:normal;margin:0px"><font face="arial, sans-serif"><font style="vertical-align:inherit"><font style="vertical-align:inherit"><b>When:</b>    </font></font><font style="vertical-align:inherit"><font style="vertical-align:inherit">  Thursday, February 11th at<b> 11:10 am CT</b></font></font><br></font></p><p class="MsoNormal" style="margin:0in 0in 0.0001pt;line-height:normal;background-image:initial;background-position:initial;background-size:initial;background-repeat:initial;background-origin:initial;background-clip:initial"><font face="arial, sans-serif"> </font></p><p class="MsoNormal" style="margin:0in 0in 0.0001pt;line-height:normal;background-image:initial;background-position:initial;background-size:initial;background-repeat:initial;background-origin:initial;background-clip:initial"><font face="arial, sans-serif"><font style="vertical-align:inherit"><font style="vertical-align:inherit"><b>Where:</b>     </font></font><font color="#000000">Zoom Virtual Talk (</font><b><font color="#0000ff"><a href="https://uchicagogroup.zoom.us/webinar/register/WN_I0AksS6uQc6AMDukDKcKJg" target="_blank">register in advance here</a></font></b><font color="#000000">)</font></font></p><p class="MsoNormal" style="margin:0in 0in 0.0001pt;line-height:normal;background-image:initial;background-position:initial;background-size:initial;background-repeat:initial;background-origin:initial;background-clip:initial"><font face="arial, sans-serif"> </font></p><p class="MsoNormal" style="margin:0in 0in 0.0001pt;line-height:normal;background-image:initial;background-position:initial;background-size:initial;background-repeat:initial;background-origin:initial;background-clip:initial"><font face="arial, sans-serif"><font style="vertical-align:inherit"><font style="vertical-align:inherit"><b>Who: </b>       Stephen Mussmann, Stanford University</font></font></font></p></div><div><font face="arial, sans-serif"><br></font></div><p style="color:rgb(60,64,67);letter-spacing:0.2px;white-space:pre-wrap"><font face="arial, sans-serif"><b>Title:        </b>Bridging Theory and Practice in Active Learning</font></p><p style="color:rgb(60,64,67);letter-spacing:0.2px;white-space:pre-wrap"><font face="arial, sans-serif"><b>Abstract:<br></b>The size of modern datasets has powered many recent successes in machine learning, but also has made data collection expensive. Adaptive data collection, or active learning, can require fewer labels both in theory and practice. Unfortunately, in the active learning literature, theory and practice are quite distinct and disconnected. In this talk, I work to bridge this gap by presenting three projects: one connecting theory and practice, one practical, and one theoretical. In the first project, we show empirically and theoretically that the data efficiency of uncertainty sampling is inversely proportional to the error of the optimal classifier for logistic regression. In the second project, we then use this insight to apply uncertainty sampling to an extremely imbalanced pairwise classification task, paraphrase detection, where we achieve a fourteen-fold reduction in the amount of data required to reach a particular performance level. Finally, in the third project, for a classic formulation of active learning, decision trees, we provide a tight analysis of the greedy algorithm with a uniform prior, resolving a 20-year-old conjecture and yielding a subexponential time algorithm.</font></p><font face="arial, sans-serif"><b style="color:rgb(60,64,67);letter-spacing:0.2px;white-space:pre-wrap">Bio:</b><br style="color:rgb(60,64,67);letter-spacing:0.2px;white-space:pre-wrap"><span style="color:rgb(60,64,67);letter-spacing:0.2px;white-space:pre-wrap">Steve Mussmann is a PhD candidate in Computer Science at Stanford University advised by Percy Liang and in his sixth and final year. His research goal is to develop and understand methods to adaptively collect data more efficiently. He received his B.S. from Purdue University in 2015 and was supported during his PhD by a 2016 NSF GRFP fellowship.</span><br clear="all"></font></div><div><span style="color:rgb(60,64,67);letter-spacing:0.2px;white-space:pre-wrap"><font face="arial, sans-serif"><br></font></span></div><div><span style="color:rgb(60,64,67);letter-spacing:0.2px;white-space:pre-wrap"><font face="arial, sans-serif"><b>Host:</b> <a href="mailto:nati@ttic.edu" target="_blank"><b>Nathan Srebro</b></a></font></span></div><div><span style="color:rgb(60,64,67);letter-spacing:0.2px;white-space:pre-wrap"><font face="arial, sans-serif"><br></font></span></div><div style="font-size:small"><span style="color:rgb(60,64,67);font-family:Roboto,Arial,sans-serif;font-size:14px;letter-spacing:0.2px;white-space:pre-wrap"><br></span></div><div style="font-size:small"><span style="color:rgb(60,64,67);font-family:Roboto,Arial,sans-serif;font-size:14px;letter-spacing:0.2px;white-space:pre-wrap"><br></span></div><div><div dir="ltr"><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><font face="arial, helvetica, sans-serif">Mary C. Marre</font><div><font face="arial, helvetica, sans-serif">Faculty Administrative Support</font></div><div><i><font face="arial, helvetica, sans-serif" color="#3d85c6"><b>Toyota Technological Institute</b></font></i></div><div><i><font face="arial, helvetica, sans-serif" color="#3d85c6">6045 S. Kenwood Avenue</font></i></div><div><i><font face="arial, helvetica, sans-serif" color="#3d85c6">Room 517</font></i></div><div><i><font face="arial, helvetica, sans-serif" color="#3d85c6">Chicago, IL  60637</font></i></div><div><i><font face="arial, helvetica, sans-serif">p:(773) 834-1757</font></i></div><div><i><font face="arial, helvetica, sans-serif">f: (773) 357-6970</font></i></div><div><b><i><a href="mailto:mmarre@ttic.edu" target="_blank"><font face="arial, helvetica, sans-serif">mmarre@ttic.edu</font></a></i></b></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div>
</blockquote></div></div>
</blockquote></div></div>
</blockquote></div></div>