<div dir="ltr"><div><div style="font-size:12.8px"><font face="arial, helvetica, sans-serif"><span style="font-size:12.8px">When:</span><b style="font-size:12.8px"> </b><span style="font-size:12.8px">    </span><span style="font-size:12.8px">Monday, May 22nd at 11:00 a.m.</span><span style="font-size:12.8px"> </span><br></font></div><div dir="ltr" style="font-size:12.8px"><div style="font-size:12.8px"><font face="arial, helvetica, sans-serif"><br></font></div><div style="font-size:12.8px"><font face="arial, helvetica, sans-serif">Where:    TTIC, 6045 S. Kenwood Avenue, 5th Floor, Room 526</font></div><div style="font-size:12.8px"><font face="arial, helvetica, sans-serif"><br></font></div><div style="font-size:12.8px"><font face="arial, helvetica, sans-serif" style="font-size:12.8px">Who:      Aron Culotta, </font><span style="font-size:12.8px">Illinois Institute of Technology</span></div></div></div><div><br></div><div><br></div><div dir="ltr" style="font-size:12.8px"><span style="font-size:12.8px">Title:</span></div><div dir="ltr" style="font-size:12.8px"><span style="font-size:12.8px">Observational studies from social media using robust text classification and learning from label proportions</span><br></div><div dir="ltr" style="font-size:12.8px"><br></div><div style="font-size:12.8px">Abstract:</div><div style="font-size:12.8px">Observational studies conducted with online social internet data have the potential to provide insights into human sciences such as public health, sociology, political science, and marketing. A key difficulty is that<span style="font-size:12.8px"> the variables of interest are rarely observed and so must be estimated by classification models that use features from user-generated text or social connections. In this talk, I will discuss two lines of research to support this approach. First, since it is critical that classifiers are not biased by socio-economic or demographic variables, I will present a method to train a text classifier while controlling for such covariates, even when they are unobserved. Second, because user demographics are rarely observed, and labeled training data is difficult to obtain, I will present a Learning from Label Proportions (LLP) approach that trains a demographics classifier from sets of users paired with population statistics (e.g., from the U.S. Census). Finally, I will discuss a recent co-training method for LLP that uses deep learning to combine text features with a user's profile image to predict demographics.</span></div><div style="font-size:12.8px"><br></div><div dir="ltr" style="font-size:12.8px"><div>Bio:</div><div><span style="font-size:12.8px">Aron Culotta is an Assistant Professor of Computer Science at the Illinois Institute of Technology in Chicago, where he leads the Text Analysis in the Public Interest lab (</span><a href="http://tapilab.github.io/" target="_blank" style="font-size:12.8px">http://tapilab.github.io/</a><span style="font-size:12.8px">). He obtained his Ph.D. in Computer Science from the University of Massachusetts, Amherst in 2008, where he developed machine learning algorithms for natural language processing. He was a Microsoft </span><span style="font-size:12.8px">Live</span><span style="font-size:12.8px"> </span><span style="font-size:12.8px">Labs</span><span style="font-size:12.8px"> Fellow and completed research internships at IBM, Google, and Microsoft Research. His work has received best paper awards at AAAI and CSCW. He is Managing Editor of JMLR and an SPC member for AAAI and ICHI.</span></div><div><span style="font-size:12.8px"><br></span></div><div><span style="font-size:12.8px"><br></span></div><div><span style="font-size:12.8px">Host: <a href="mailto:kgimpel@ttic.edu">Kevin Gimpel</a></span></div><div><span style="font-size:12.8px"><br></span></div><div><span style="font-size:12.8px"><br></span></div><div><span style="font-family:arial,helvetica,sans-serif;font-size:12.8px">For more information on the </span><span style="font-family:arial,helvetica,sans-serif;font-size:12.8px">colloquium</span><span style="font-family:arial,helvetica,sans-serif;font-size:12.8px"> series or to subscribe to the mailing list, please see </span><a href="http://www.ttic.edu/colloquium.php" target="_blank" style="font-family:arial,helvetica,sans-serif;font-size:12.8px">http://www.ttic.edu/colloq<wbr>uium.php</a><span style="font-size:12.8px"><br></span></div><div><br></div><div><br></div><div><br></div><div><span style="font-size:12.8px"><br></span></div><div><span style="font-size:12.8px"><br></span></div></div><div><div class="gmail_signature"><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><font face="arial, helvetica, sans-serif">Mary C. Marre</font><div><font face="arial, helvetica, sans-serif">Administrative Assistant</font></div><div><i><font face="arial, helvetica, sans-serif" color="#3d85c6"><b>Toyota Technological Institute</b></font></i></div><div><i><font face="arial, helvetica, sans-serif" color="#3d85c6">6045 S. Kenwood Avenue</font></i></div><div><i><font face="arial, helvetica, sans-serif" color="#3d85c6">Room 504</font></i></div><div><i><font face="arial, helvetica, sans-serif" color="#3d85c6">Chicago, IL  60637</font></i></div><div><i><font face="arial, helvetica, sans-serif">p:(773) 834-1757</font></i></div><div><i><font face="arial, helvetica, sans-serif">f: (773) 357-6970</font></i></div><div><b><i><a href="mailto:mmarre@ttic.edu" target="_blank"><font face="arial, helvetica, sans-serif">mmarre@ttic.edu</font></a></i></b></div></div></div></div></div></div></div></div></div></div>
</div>