<html><head><meta http-equiv="Content-Type" content="text/html; charset=utf-8"></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class=""><div class=""><div style="caret-color: rgb(0, 0, 0); color: rgb(0, 0, 0);" class="">This is an announcement of Alex Zhao's MS Presentation. Alex is a student in the Bx/MS program.</div><div style="caret-color: rgb(0, 0, 0); color: rgb(0, 0, 0);" class=""><br class=""></div><div style="caret-color: rgb(0, 0, 0); color: rgb(0, 0, 0);" class="">Zoom details will follow.</div><div style="caret-color: rgb(0, 0, 0); color: rgb(0, 0, 0);" class=""><br class=""></div><div class=""><font color="#000000" class="">————————————————————————————————————————————————————————————————————</font></div><div style="caret-color: rgb(0, 0, 0); color: rgb(0, 0, 0);" class=""><span class=""><br class=""></span></div><div style="caret-color: rgb(0, 0, 0); color: rgb(0, 0, 0);" class=""><span class=""><b class="">Date:</b> Friday, May 21, 2021</span></div><div style="caret-color: rgb(0, 0, 0); color: rgb(0, 0, 0);" class=""><span class=""><br class=""></span></div><div style="caret-color: rgb(0, 0, 0); color: rgb(0, 0, 0);" class=""><span class=""><b class="">Time:</b> 8:30 AM, CST</span></div><div style="caret-color: rgb(0, 0, 0); color: rgb(0, 0, 0);" class=""><span class=""><br class=""></span></div><div style="caret-color: rgb(0, 0, 0); color: rgb(0, 0, 0);" class=""><span class=""><b class="">Location:</b> </span>remote via Zoom</div><div style="caret-color: rgb(0, 0, 0); color: rgb(0, 0, 0);" class=""><br class=""></div><div style="caret-color: rgb(0, 0, 0); color: rgb(0, 0, 0);" class=""><b class="">M.S. Candidate:</b> Alex Zhao</div><div style="caret-color: rgb(0, 0, 0); color: rgb(0, 0, 0);" class=""><br class=""></div><div style="caret-color: rgb(0, 0, 0); color: rgb(0, 0, 0);" class=""><b class="">M.S. Paper Title:</b> Boosting Machine Learning Performance with Relational Embedding Data Augmentation</div><div style="caret-color: rgb(0, 0, 0); color: rgb(0, 0, 0);" class=""><br class=""></div><div style="caret-color: rgb(0, 0, 0); color: rgb(0, 0, 0);" class=""><b class="">Advisor:</b> Raul Castro Fernandez</div><div style="caret-color: rgb(0, 0, 0); color: rgb(0, 0, 0);" class=""><br class=""></div><div style="caret-color: rgb(0, 0, 0); color: rgb(0, 0, 0);" class=""><b class="">Committee Members:</b> Aaron Elmore, Sanjay Krishnan, and Raul Castro Fernandez</div><div style="caret-color: rgb(0, 0, 0); color: rgb(0, 0, 0);" class=""><br class=""></div><div style="caret-color: rgb(0, 0, 0); color: rgb(0, 0, 0);" class=""><br class=""></div><div style="caret-color: rgb(0, 0, 0); color: rgb(0, 0, 0);" class=""><b class="">Abstract:</b></div><div style="caret-color: rgb(0, 0, 0); color: rgb(0, 0, 0);" class="">---------------------------------------------------------------------------------</div><div class=""><font color="#000000" class=""><span style="caret-color: rgb(0, 0, 0);" class="">Training machine learning models on relational data involves identifying schema relations, combining tables, and engineering features. Extensive human effort in the process poses difficulty for users who are unfamiliar with the dataset and creates an awkward dilemma where users have to forgo performance boost to save effort. In our research, we present Leva, an end-to-end system that produces distributed vector representations of relational data that can be directly fed as inputs for downstream machine learning tasks. Leva processes and embeds information across different tables into compact vector representations without any prior knowledge of database schema. When used as featurized inputs for downstream tasks, the embedding (1) saves the trouble of relation identification, join execution and feature engineering (2) closely resembles, and in some cases, outperforms, heavily-engineered joining solutions. We show that using embedding as featurized inputs generalizes well across tasks and datasets.</span></font></div><div style="caret-color: rgb(0, 0, 0); color: rgb(0, 0, 0);" class="">------------------------------------------------------------------------------------------</div></div><div class=""><br class=""></div><div class=""><br class=""></div><div class="">
<div dir="auto" style="caret-color: rgb(0, 0, 0); color: rgb(0, 0, 0); letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none; word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class=""><div>Jessica Garza<br class="">Assistant Director of Undergraduate Studies<br class="">Department of Computer Science<br class="">The University of Chicago<br class=""><a href="https://cs.uchicago.edu/remote2020/" class="">Covid-19 Resources</a></div></div>

</div>
<br class=""></body></html>