<div dir="ltr">Hi all.  Nina Balcan will be at TTIC and giving a talk this Thurs at 12:30 on Foundations of Data-Driven Algorithm Design.  We'll have pizza at 12:00.   Talk info is below.  <div><br></div><div>Best, </div><div>-Avrim<div><br></div><div>

<span style="font-size:12.8px">Speaker:</span><br><blockquote style="font-size:12.8px;background-color:rgb(255,255,255);text-decoration-style:initial;text-decoration-color:initial;margin:0px 0px 0px 40px;border:none;padding:0px"><div>Maria-Florina<span> </span><span class="m_-5294179208488947369gmail-il">Balcan</span><br></div><div>Carnegie Mellon University</div><div><br></div></blockquote><span style="font-size:12.8px">Title:</span><br><blockquote style="font-size:12.8px;background-color:rgb(255,255,255);text-decoration-style:initial;text-decoration-color:initial;margin:0px 0px 0px 40px;border:none;padding:0px"><div><div>Foundations of Data Driven Algorithm Design.</div></div><div><div> </div></div></blockquote><span style="font-size:12.8px">Abstract:</span><br><blockquote style="font-size:12.8px;background-color:rgb(255,255,255);text-decoration-style:initial;text-decoration-color:initial;margin:0px 0px 0px 40px;border:none;padding:0px"><div><div>Data driven algorithm design is an important aspect of modern data science and algorithm design. Rather than using off the shelf algorithms that only have worst case performance guarantees, practitioners typically optimize over large families of parametrized algorithms and tune the parameters of these algorithms using a training set of problem instances from their domain to determine a configuration with high expected performance over future instances. However, most of this work comes with no performance guarantees. The challenge is that for many combinatorial problems of significant importance to machine learning, including partitioning and subset selection problems, a small tweak to the parameters can cause a cascade of changes in the algorithm’s behavior, so the algorithm’s performance is a discontinuous function of its parameters. In this talk, I will present new work that helps put data driven combinatorial algorithm selection on firm foundations. We provide strong computational and statistical performance guarantees for several subset selection and combinatorial partitioning problems (including various forms of clustering), both for the batch and online scenarios where a collection of typical problem instances from the given application are presented either all at once or in an online fashion, respectively.</div></div></blockquote></div><div><div><br></div><div><div><div class="m_-5294179208488947369gmail_signature" data-smartmail="gmail_signature"><div dir="ltr"><div><div dir="ltr"></div></div></div></div></div>
</div></div></div></div>